[python] 파이썬 pandas에서 데이터를 가공하는 방법은 무엇인가요?
1. 데이터 불러오기
import pandas as pd
data = pd.read_csv('file.csv')
2. 데이터 확인하기
print(data.head()) # 처음 5개 행 출력
print(data.describe()) # 기술 통계량 확인
print(data.info()) # 데이터 정보 확인
3. 데이터 선택 및 필터링
selected_data = data[['column1', 'column2']] # 특정 열 선택
filtered_data = data[data['column1'] > 10] # 조건에 맞는 행 필터링
4. 데이터 가공하기
data['new_column'] = data['column1'] + data['column2'] # 새로운 열 추가
data.dropna() # 결측치 제거
5. 그룹화 및 집계
grouped_data = data.groupby('category').mean() # 카테고리별 평균 집계
이외에도 다양한 기능과 메소드가 있으니 Pandas 공식 문서를 참고하시기 바랍니다.