[python] 파이썬 pandas에서 데이터를 그룹화하는 방법은 무엇인가요?

먼저, 데이터프레임을 특정 열을 기준으로 그룹화하려면 다음과 같이 작성합니다:

grouped = df.groupby('column_name')

여기서 df는 데이터프레임 객체이고, 'column_name'은 그룹화할 기준이 되는 열의 이름입니다.

또는 여러 열을 기준으로 데이터를 그룹화할 수도 있습니다:

grouped = df.groupby(['column1', 'column2'])

이렇게 하면 여러 열의 조합에 따라 데이터가 그룹화됩니다.

데이터를 그룹화한 후에는 해당 그룹에 대해 다양한 연산을 수행할 수 있습니다. 예를 들어, 각 그룹의 평균을 구하려면 다음과 같이 작성합니다:

grouped.mean()

이렇게 하면 각 그룹에 대한 평균이 계산된 결과가 출력됩니다.

판다스의 groupby 메서드를 사용하여 데이터를 그룹화하고 그룹에 대해 연산을 수행하는 것은 데이터 분석 및 요약에 유용한 방법입니다.