[python] 파이썬 pandas에서 데이터를 변환하는 방법은 무엇인가요?

가장 일반적인 데이터 변환 작업은 다음과 같습니다:

  1. 새 열 추가: 기존 열을 기반으로 새로운 열을 만들거나 외부 데이터를 가져와 새로운 열을 추가합니다.
  2. 열 삭제: 불필요한 열을 제거합니다.
  3. 데이터 형식 변환: 숫자형 데이터를 문자열로 변환하거나, 날짜 형식을 변경합니다.
  4. 결측치 처리: 결측치를 채우거나 제거합니다.
  5. 데이터프레임 합치기: 두 개 이상의 데이터프레임을 합치거나 결합하여 새로운 데이터프레임을 만듭니다.

이러한 작업을 수행하기 위해 pandas의 다양한 기능과 메소드를 사용할 수 있습니다. 간단한 예제를 통해 데이터 변환 방법을 살펴보겠습니다.

import pandas as pd

# Sample DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'Salary': [50000, 60000, 75000]}

df = pd.DataFrame(data)

# New column added
df['Income_Level'] = pd.cut(df['Salary'], bins=[0, 60000, 80000], labels=['Low', 'High'])

# Column deleted
df.drop('Salary', axis=1, inplace=True)

# Data type conversion
df['Age'] = df['Age'].astype(str)

# Handling missing values
df.fillna(0, inplace=True)

# Merging DataFrames
other_data = {'Name': ['David', 'Emily'],
              'Age': [28, 32],
              'Income_Level': ['High', 'Low']}
df2 = pd.DataFrame(other_data)
merged_df = pd.concat([df, df2])

위의 예제에서는 새 열을 추가하고, 열을 삭제하며, 데이터 형식을 변경하고, 결측치를 처리하며, 두 개의 데이터프레임을 합치는 방법을 보여줍니다.

더 많은 데이터 변환 기술과 메소드에 대한 정보는 pandas 공식 문서나 관련된 온라인 자료를 참고하시기 바랍니다.