[python] 파이썬 pandas에서 HDF5 파일을 다루는 방법은 무엇인가요?

HDF5 (Hierarchical Data Format version 5)는 대량의 과학 및 공학 데이터를 저장하고 조직화하기 위한 파일 형식입니다. Pandas는 이 형식의 데이터를 읽고 쓸 수 있도록 지원합니다.

HDF5 파일 작성하기

Pandas를 사용하여 HDF5 파일을 생성하고 데이터프레임을 저장할 수 있습니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# HDF5 파일에 데이터프레임 저장
df.to_hdf('data.h5', key='df', mode='w')

위 코드는 data.h5라는 이름의 HDF5 파일을 생성하고 데이터프레임을 저장합니다. key는 데이터프레임을 식별하는 데 사용되며, mode는 파일이 이미 존재하는 경우 덮어쓸 것인지를 결정합니다.

HDF5 파일에서 데이터 읽기

이제 생성된 HDF5 파일에서 데이터를 읽어올 수 있습니다.

# HDF5 파일에서 데이터프레임 읽기
df = pd.read_hdf('data.h5', key='df')
print(df)

위 코드는 data.h5 파일에서 데이터를 읽어와 df 변수에 저장하고 출력합니다.

Pandas를 사용하여 HDF5 파일을 다루는 방법에 대한 간단한 예제를 살펴보았습니다. 이를 통해 Pandas를 활용하여 대량의 데이터를 효율적으로 다룰 수 있는 방법을 파악할 수 있습니다.

더 많은 정보를 원하시면 Pandas 공식 문서를 참고하실 수 있습니다.