pandas는 Python에서 데이터 분석과 조작을 위한 강력한 라이브러리입니다. 데이터를 로드하고 조작한 후 원하는 형식으로 출력하거나 다양한 데이터 형식으로 저장하는 기능을 제공합니다. 이번 블로그 포스트에서는 pandas를 사용하여 데이터를 출력하고 저장하는 방법을 소개하겠습니다.
데이터 출력하기
pandas는 데이터를 다양한 형식으로 출력할 수 있는 유연한 기능을 제공합니다. 여기에서는 가장 일반적인 출력 방법인 데이터프레임의 내용을 화면에 출력하는 방법을 살펴보겠습니다.
import pandas as pd
# 데이터프레임 생성
data = {'Name': ['John', 'Emma', 'Mike', 'Lisa'],
'Age': [25, 28, 23, 30],
'City': ['Seoul', 'New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# 데이터프레임 출력
print(df)
출력 결과는 다음과 같습니다:
Name Age City
0 John 25 Seoul
1 Emma 28 New York
2 Mike 23 London
3 Lisa 30 Paris
데이터프레임의 내용이 행과 열로 구성되어 화면에 표시됩니다.
데이터 저장하기
pandas를 사용하여 데이터를 다양한 형식으로 저장할 수 있습니다. 대표적인 방법으로는 CSV, Excel, JSON 등이 있습니다. 각각의 형식에 따라 알맞은 함수를 사용하여 데이터를 저장할 수 있습니다.
CSV로 저장하기
# CSV로 저장
df.to_csv('data.csv', index=False)
위의 코드는 데이터프레임을 data.csv
라는 이름의 파일로 저장하는 예시입니다. index=False
를 사용하면 인덱스를 저장하지 않습니다.
Excel로 저장하기
# Excel로 저장
df.to_excel('data.xlsx', index=False, sheet_name='Sheet1')
위의 코드는 데이터프레임을 data.xlsx
라는 이름의 파일로 저장하는 예시입니다. index=False
를 사용하면 인덱스를 저장하지 않고, sheet_name
으로 원하는 시트의 이름을 지정할 수 있습니다.
JSON으로 저장하기
# JSON으로 저장
df.to_json('data.json', orient='records')
위의 코드는 데이터프레임을 data.json
이라는 이름의 파일로 저장하는 예시입니다. orient='records'
를 사용하면 JSON 형식으로 저장됩니다.
결론
이번에는 pandas를 사용하여 데이터를 출력하고 저장하는 방법을 알아보았습니다. pandas의 유연한 출력과 저장 기능을 활용하면 다양한 데이터를 원하는 형식으로 손쉽게 다룰 수 있습니다. 추가적인 정보는 pandas 문서를 참조하면 좋습니다.