[python] 파이썬 pandas에서 데이터프레임의 특정 열을 기준으로 데이터를 그룹화하는 방법은 무엇인가요?
우선, groupby
함수를 사용하여 데이터를 그룹화할 수 있습니다. 이 함수는 데이터프레임을 지정된 열을 기준으로 그룹화하여 그룹화된 데이터를 나타내는 GroupBy
객체를 반환합니다.
아래는 실제 예제 코드입니다.
import pandas as pd
# 샘플 데이터프레임 생성
data = {'Key': ['A', 'B', 'A', 'B', 'C'],
'Value': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# Key 열을 기준으로 데이터를 그룹화
grouped = df.groupby('Key')
# 그룹화된 데이터 출력
for key, group in grouped:
print(key)
print(group)
위 코드에서는 Key
열을 기준으로 데이터를 그룹화하고, 각 그룹을 출력하는 예제입니다.
자세한 내용은 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html 를 참조하시기 바랍니다.