[python] 판다스를 이용한 데이터 피벗
이 블로그 포스트에서는 데이터 피벗을 어떻게 사용하고 Pandas를 이용하여 데이터를 재구성하는지 알아보겠습니다.
목차
- 데이터 피벗이란?
- Pandas를 사용하여 데이터 피벗하기
- 예제로 알아보는 데이터 피벗
1. 데이터 피벗이란?
데이터 피벗은 테이블의 한 형태를 다른 형태로 재구성하는 데이터 조작 기술입니다. 주로 데이터 분석에서 사용되며, 특히 엑셀의 피벗 테이블과 유사한 개념입니다. 데이터 피벗을 사용하면 데이터를 원하는 형태로 손쉽게 재배열할 수 있습니다.
2. Pandas를 사용하여 데이터 피벗하기
Pandas는 파이썬의 데이터 조작 및 분석을 위한 라이브러리로, 데이터 피벗을 수행하는 데 유용하게 사용됩니다. 아래는 Pandas를 사용하여 데이터 피벗하는 간단한 예제입니다.
import pandas as pd
# 데이터 프레임 생성
data = {'일자': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02'],
'지역': ['서울', '부산', '서울', '부산'],
'온도': [5, 10, 3, 8],
'습도': [55, 40, 60, 45]}
df = pd.DataFrame(data)
# 데이터 피벗
pivot_table = df.pivot(index='일자', columns='지역', values=['온도', '습도'])
print(pivot_table)
3. 예제로 알아보는 데이터 피벗
위 예제에서 사용된 데이터 프레임을 피벗하면 날짜별로 지역의 온도와 습도를 쉽게 비교할 수 있습니다. 데이터 피벗을 통해 원하는 형태의 데이터를 얻을 수 있어 데이터 분석 작업에 매우 유용합니다.
이상으로 Pandas를 사용하여 데이터 피벗하는 방법에 대해 알아보았습니다. 데이터 피벗은 데이터 분석 작업을 보다 효율적으로 수행할 수 있도록 도와주는 강력한 도구입니다.
관련 자료: Pandas Documentation