[python] 파이썬 pandas에서 데이터를 변환하는 방법은 무엇인가요?
가장 일반적인 데이터 변환 작업은 다음과 같습니다:
- 새 열 추가: 기존 열을 기반으로 새로운 열을 만들거나 외부 데이터를 가져와 새로운 열을 추가합니다.
- 열 삭제: 불필요한 열을 제거합니다.
- 데이터 형식 변환: 숫자형 데이터를 문자열로 변환하거나, 날짜 형식을 변경합니다.
- 결측치 처리: 결측치를 채우거나 제거합니다.
- 데이터프레임 합치기: 두 개 이상의 데이터프레임을 합치거나 결합하여 새로운 데이터프레임을 만듭니다.
이러한 작업을 수행하기 위해 pandas의 다양한 기능과 메소드를 사용할 수 있습니다. 간단한 예제를 통해 데이터 변환 방법을 살펴보겠습니다.
import pandas as pd
# Sample DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'Salary': [50000, 60000, 75000]}
df = pd.DataFrame(data)
# New column added
df['Income_Level'] = pd.cut(df['Salary'], bins=[0, 60000, 80000], labels=['Low', 'High'])
# Column deleted
df.drop('Salary', axis=1, inplace=True)
# Data type conversion
df['Age'] = df['Age'].astype(str)
# Handling missing values
df.fillna(0, inplace=True)
# Merging DataFrames
other_data = {'Name': ['David', 'Emily'],
'Age': [28, 32],
'Income_Level': ['High', 'Low']}
df2 = pd.DataFrame(other_data)
merged_df = pd.concat([df, df2])
위의 예제에서는 새 열을 추가하고, 열을 삭제하며, 데이터 형식을 변경하고, 결측치를 처리하며, 두 개의 데이터프레임을 합치는 방법을 보여줍니다.
더 많은 데이터 변환 기술과 메소드에 대한 정보는 pandas 공식 문서나 관련된 온라인 자료를 참고하시기 바랍니다.