[python] 데이터 변환하기
데이터 변환은 데이터를 가져 와서 적절한 형식으로 변환하는 프로세스를 의미합니다. 이것은 데이터 스키마가 변경되거나 데이터가 다른 시스템 간에 호환되지 않을 때 매우 유용합니다. 이 기사에서는 Python을 사용하여 데이터를 변환하는 몇 가지 방법을 다루겠습니다.
1. CSV 파일 변환
CSV(Comma-Separated Values) 파일은 많은 데이터 소스에서 일반적으로 사용되는 형식이며, 데이터를 다루고 변환하는 데 유용합니다. Python의 pandas
라이브러리를 사용하여 CSV 파일을 읽고 원하는 형식으로 변환할 수 있습니다.
import pandas as pd
# CSV 파일 읽기
data = pd.read_csv('input.csv')
# 데이터 변환 로직 적용
# ...
# 변환된 데이터를 CSV 파일로 저장
data.to_csv('output.csv', index=False)
2. JSON 데이터 변환
JSON(JavaScript Object Notation)은 다른 시스템 간에 데이터를 교환하는 데 널리 사용되는 형식입니다. Python의 내장 모듈인 json
을 사용하여 JSON 데이터를 읽고 쓸 수 있습니다.
import json
# JSON 파일 읽기
with open('input.json', 'r') as file:
data = json.load(file)
# 데이터 변환 로직 적용
# ...
# 변환된 데이터를 JSON 파일로 저장
with open('output.json', 'w') as file:
json.dump(data, file, indent=4)
결론
Python은 데이터를 다양한 형식으로 변환하는 데 매우 유용한 도구입니다. pandas
및 json
라이브러리를 이용하여 CSV 및 JSON 파일을 쉽게 읽고 쓸 수 있으며, 데이터 변환 및 다양한 데이터 처리 작업을 수행할 수 있습니다.
이러한 도구들을 사용하여 데이터 변환 프로세스를 자동화하고, 데이터를 더 효율적으로 다룰 수 있는 환경을 구축할 수 있습니다.