[python] 파이썬 pandas에서 데이터를 변환하는 방법은 무엇인가요?

1. 데이터프레임 합치기

import pandas as pd

# 두 개의 데이터프레임을 합치는 예시
result = pd.concat([df1, df2])

2. 열 추가 및 제거

# 새로운 열 추가
df['new_column'] = values

# 열 제거
df.drop('column_to_drop', axis=1, inplace=True)

3. 데이터 타입 변경

# 열의 데이터 타입 변경
df['column'] = df['column'].astype('new_type')

4. 결측값 처리

# 결측값 채우기
df.fillna(value)

# 결측값이 포함된 행 제거
df.dropna()

5. 레이블 인코딩 또는 원-핫 인코딩

# 레이블 인코딩
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()
df['column'] = label_encoder.fit_transform(df['column'])

# 원-핫 인코딩
pd.get_dummies(df['column'])

이러한 데이터 변환 기술은 pandas를 활용하여 데이터를 효율적으로 처리하고 분석하는 데 도움이 됩니다.

더 많은 정보를 원하시면 아래 pandas 공식 문서를 참고하시기 바랍니다.

파이썬 Pandas 공식 문서