[python] 파이썬 pandas에서 데이터를 가공하는 방법은 무엇인가요?

1. 데이터 불러오기

import pandas as pd
data = pd.read_csv('file.csv')

2. 데이터 확인하기

print(data.head())  # 처음 5개 행 출력
print(data.describe())  # 기술 통계량 확인
print(data.info())  # 데이터 정보 확인

3. 데이터 선택 및 필터링

selected_data = data[['column1', 'column2']]  # 특정 열 선택
filtered_data = data[data['column1'] > 10]  # 조건에 맞는 행 필터링

4. 데이터 가공하기

data['new_column'] = data['column1'] + data['column2']  # 새로운 열 추가
data.dropna()  # 결측치 제거

5. 그룹화 및 집계

grouped_data = data.groupby('category').mean()  # 카테고리별 평균 집계

이외에도 다양한 기능과 메소드가 있으니 Pandas 공식 문서를 참고하시기 바랍니다.

Pandas 공식 문서