[파이썬] pandas에서 데이터 출력 및 저장

pandas는 Python에서 데이터 분석과 조작을 위한 강력한 라이브러리입니다. 데이터를 로드하고 조작한 후 원하는 형식으로 출력하거나 다양한 데이터 형식으로 저장하는 기능을 제공합니다. 이번 블로그 포스트에서는 pandas를 사용하여 데이터를 출력하고 저장하는 방법을 소개하겠습니다.

데이터 출력하기

pandas는 데이터를 다양한 형식으로 출력할 수 있는 유연한 기능을 제공합니다. 여기에서는 가장 일반적인 출력 방법인 데이터프레임의 내용을 화면에 출력하는 방법을 살펴보겠습니다.

import pandas as pd

# 데이터프레임 생성
data = {'Name': ['John', 'Emma', 'Mike', 'Lisa'],
        'Age': [25, 28, 23, 30],
        'City': ['Seoul', 'New York', 'London', 'Paris']}
df = pd.DataFrame(data)

# 데이터프레임 출력
print(df)

출력 결과는 다음과 같습니다:

   Name  Age      City
0  John   25     Seoul
1  Emma   28  New York
2  Mike   23    London
3  Lisa   30     Paris

데이터프레임의 내용이 행과 열로 구성되어 화면에 표시됩니다.

데이터 저장하기

pandas를 사용하여 데이터를 다양한 형식으로 저장할 수 있습니다. 대표적인 방법으로는 CSV, Excel, JSON 등이 있습니다. 각각의 형식에 따라 알맞은 함수를 사용하여 데이터를 저장할 수 있습니다.

CSV로 저장하기

# CSV로 저장
df.to_csv('data.csv', index=False)

위의 코드는 데이터프레임을 data.csv라는 이름의 파일로 저장하는 예시입니다. index=False를 사용하면 인덱스를 저장하지 않습니다.

Excel로 저장하기

# Excel로 저장
df.to_excel('data.xlsx', index=False, sheet_name='Sheet1')

위의 코드는 데이터프레임을 data.xlsx라는 이름의 파일로 저장하는 예시입니다. index=False를 사용하면 인덱스를 저장하지 않고, sheet_name으로 원하는 시트의 이름을 지정할 수 있습니다.

JSON으로 저장하기

# JSON으로 저장
df.to_json('data.json', orient='records')

위의 코드는 데이터프레임을 data.json이라는 이름의 파일로 저장하는 예시입니다. orient='records'를 사용하면 JSON 형식으로 저장됩니다.

결론

이번에는 pandas를 사용하여 데이터를 출력하고 저장하는 방법을 알아보았습니다. pandas의 유연한 출력과 저장 기능을 활용하면 다양한 데이터를 원하는 형식으로 손쉽게 다룰 수 있습니다. 추가적인 정보는 pandas 문서를 참조하면 좋습니다.