[python] 파이썬 pandas에서 데이터를 그룹화하는 방법은 무엇인가요?
import pandas as pd
# 데이터프레임 생성
data = {'Key': ['A', 'B', 'A', 'B', 'A', 'B'],
'Value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 'Key' 열을 기준으로 데이터 그룹화
grouped = df.groupby('Key')
# 각 그룹의 합 구하기
group_sum = grouped.sum()
print(group_sum)
위 코드에서 groupby
메서드를 사용하여 ‘Key’ 열을 기준으로 데이터를 그룹화하고, sum
메서드를 사용하여 각 그룹별 합을 계산했습니다. 위 코드를 실행하면 ‘A’와 ‘B’로 구분된 그룹별로 값의 합을 확인할 수 있습니다.
참고 문헌:
- 판다스 공식 문서: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html