[python] 판다스를 이용한 데이터 피벗

이 블로그 포스트에서는 데이터 피벗을 어떻게 사용하고 Pandas를 이용하여 데이터를 재구성하는지 알아보겠습니다.

목차

  1. 데이터 피벗이란?
  2. Pandas를 사용하여 데이터 피벗하기
  3. 예제로 알아보는 데이터 피벗

1. 데이터 피벗이란?

데이터 피벗은 테이블의 한 형태를 다른 형태로 재구성하는 데이터 조작 기술입니다. 주로 데이터 분석에서 사용되며, 특히 엑셀의 피벗 테이블과 유사한 개념입니다. 데이터 피벗을 사용하면 데이터를 원하는 형태로 손쉽게 재배열할 수 있습니다.

2. Pandas를 사용하여 데이터 피벗하기

Pandas는 파이썬의 데이터 조작 및 분석을 위한 라이브러리로, 데이터 피벗을 수행하는 데 유용하게 사용됩니다. 아래는 Pandas를 사용하여 데이터 피벗하는 간단한 예제입니다.

import pandas as pd

# 데이터 프레임 생성
data = {'일자': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02'],
        '지역': ['서울', '부산', '서울', '부산'],
        '온도': [5, 10, 3, 8],
        '습도': [55, 40, 60, 45]}
df = pd.DataFrame(data)

# 데이터 피벗
pivot_table = df.pivot(index='일자', columns='지역', values=['온도', '습도'])
print(pivot_table)

3. 예제로 알아보는 데이터 피벗

위 예제에서 사용된 데이터 프레임을 피벗하면 날짜별로 지역의 온도와 습도를 쉽게 비교할 수 있습니다. 데이터 피벗을 통해 원하는 형태의 데이터를 얻을 수 있어 데이터 분석 작업에 매우 유용합니다.

이상으로 Pandas를 사용하여 데이터 피벗하는 방법에 대해 알아보았습니다. 데이터 피벗은 데이터 분석 작업을 보다 효율적으로 수행할 수 있도록 도와주는 강력한 도구입니다.

관련 자료: Pandas Documentation