[python] Pandas의 날짜 및 시간 데이터 처리 기능

Pandas는 데이터 분석 및 조작을 위한 파이썬 라이브러리로, 날짜와 시간 데이터 처리에 매우 강력한 기능을 제공합니다. 이를 통해 시계열 데이터를 효과적으로 다룰 수 있습니다. 이번 포스트에서는 Pandas를 사용하여 날짜와 시간 데이터를 다루는 방법에 대해 알아보겠습니다.

날짜 및 시간 데이터의 생성

날짜 생성

Pandas에서는 Timestamp를 사용하여 날짜를 생성할 수 있습니다. 아래는 날짜를 생성하는 간단한 예제입니다.

import pandas as pd

date = pd.Timestamp('2022-12-31')
print(date)

시간 생성

시간을 포함한 날짜 데이터를 생성하려면 Timestamp를 사용하여 시간까지 지정할 수 있습니다.

time = pd.Timestamp('2022-12-31 15:45:00')
print(time)

날짜 및 시간 데이터의 인덱싱

Pandas에서는 날짜 및 시간 데이터를 인덱싱할 수 있습니다. 특정 기간의 데이터를 선택하거나 조작할 때 유용합니다.

data['2022-01-01':'2022-12-31']

날짜 및 시간 데이터의 변환

Pandas는 문자열 형식의 날짜 데이터를 to_datetime 메서드를 사용하여 날짜 형식으로 변환할 수 있습니다.

date_str = '2022-12-31'
date = pd.to_datetime(date_str)
print(date)

날짜 및 시간 데이터의 연산

날짜 및 시간 데이터 사이의 연산도 간편하게 수행할 수 있습니다.

date1 = pd.Timestamp('2022-12-31')
date2 = pd.Timestamp('2023-01-01')
days_diff = date2 - date1
print(days_diff.days)

Pandas는 이 외에도 날짜 및 시간 데이터를 다루는 다양한 기능을 제공합니다.

위의 간단한 예제를 통해 Pandas의 날짜 및 시간 데이터 처리 기능에 대해 알아보았습니다. Pandas를 사용하면 시계열 데이터를 쉽게 처리하고 분석할 수 있으며, 날짜와 시간 데이터에 대한 다양한 요구에 대응할 수 있습니다.

더 많은 정보는 Pandas 공식 문서를 참고하시기 바랍니다.

참고 자료 - Pandas 공식 문서