[python] 파이썬 pandas에서 데이터를 집계하는 방법은 무엇인가요?

[python] 파이썬 pandas에서 데이터를 집계하는 방법은 무엇인가요?

20 Dec 2023

python

1. `groupby`를 사용한 그룹화 및 집계

import pandas as pd

# 데이터프레임 생성
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Diana', 'Eric'],
        'Age': [25, 30, 35, 40, 45],
        'Salary': [50000, 60000, 70000, 80000, 90000]}
df = pd.DataFrame(data)

# 'Name' 열을 기준으로 데이터를 그룹화하고 'Salary'의 평균을 구함
average_salary = df.groupby('Name')['Salary'].mean()

2. `agg`를 사용한 다중 집계

# 'Name' 열을 기준으로 'Age'의 최솟값과 최댓값, 'Salary'의 평균을 구함
stats = df.groupby('Name').agg({'Age': ['min', 'max'], 'Salary': 'mean'})

3. `pivot_table`을 사용한 크로스 탭 집계

# 'Name'을 인덱스로, 'Age'를 값으로 하는 피벗 테이블 생성
pivot = df.pivot_table(index='Name', values='Age')

이러한 함수들을 이용하여 다양한 방식으로 데이터를 집계할 수 있습니다. 또한, 판다스의 다른 함수들과 조합하여 더욱 복잡한 집계를 수행할 수 있습니다.

판다스 공식 문서에서 더 자세한 정보를 확인할 수 있습니다: Pandas Documentation