[python] 파이썬 pandas에서 데이터프레임의 특정 열을 기준으로 데이터를 집계하는 방법은 무엇인가요?

예를 들어, 다음은 판다스 데이터프레임을 사용하여 ‘city’ 열을 기준으로 ‘population’ 열을 합계로 집계하는 예제입니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'city': ['Seoul', 'Seoul', 'Busan', 'Busan', 'Daegu'],
        'population': [10000000, 9500000, 3500000, 3700000, 2500000]}
df = pd.DataFrame(data)

# 'city' 열을 기준으로 'population' 열을 합산
aggregated_data = df.groupby('city')['population'].sum()
print(aggregated_data)

위 코드는 ‘city’ 열을 기준으로 ‘population’ 열을 합산하여 집계한 결과를 출력합니다.

groupby 메서드를 사용하면 다양한 집계 함수를 적용할 수 있으며, 이를 통해 데이터프레임의 특정 열을 기준으로 다양한 데이터 집계 작업을 수행할 수 있습니다.

자세한 내용은 판다스 공식 문서를 참고하시기 바랍니다: 판다스 공식 문서 - 그룹화