[python] 파이썬 pandas에서 데이터를 그룹화하는 방법은 무엇인가요?
먼저, 데이터프레임을 특정 열을 기준으로 그룹화하려면 다음과 같이 작성합니다:
grouped = df.groupby('column_name')
여기서 df
는 데이터프레임 객체이고, 'column_name'
은 그룹화할 기준이 되는 열의 이름입니다.
또는 여러 열을 기준으로 데이터를 그룹화할 수도 있습니다:
grouped = df.groupby(['column1', 'column2'])
이렇게 하면 여러 열의 조합에 따라 데이터가 그룹화됩니다.
데이터를 그룹화한 후에는 해당 그룹에 대해 다양한 연산을 수행할 수 있습니다. 예를 들어, 각 그룹의 평균을 구하려면 다음과 같이 작성합니다:
grouped.mean()
이렇게 하면 각 그룹에 대한 평균이 계산된 결과가 출력됩니다.
판다스의 groupby
메서드를 사용하여 데이터를 그룹화하고 그룹에 대해 연산을 수행하는 것은 데이터 분석 및 요약에 유용한 방법입니다.