[python] 파이썬 pandas에서 데이터를 인코딩하는 방법은 무엇인가요?

데이터 프레임의 인코딩

판다스에서 데이터 프레임의 인코딩은 주로 to_csv 함수를 사용하여 데이터를 특정 인코딩으로 저장하는 방법으로 이루어집니다. 예를 들어, 데이터프레임을 CSV 파일로 저장할 때, encoding 매개변수를 사용하여 특정 인코딩을 지정할 수 있습니다.

다음은 UTF-8로 데이터프레임을 CSV 파일로 저장하는 예제입니다.

import pandas as pd

# 데이터프레임 생성
data = {'이름': ['철수', '영희', '민수'],
        '나이': [25, 30, 35]}
df = pd.DataFrame(data)

# CSV 파일로 저장 (UTF-8로 인코딩)
df.to_csv('data.csv', encoding='utf-8')

위의 예제에서 encoding 매개변수를 사용하여 UTF-8로 데이터를 인코딩하여 CSV 파일로 저장한 것을 확인할 수 있습니다.

또한, 데이터프레임을 읽을 때 특정 인코딩으로부터 데이터를 읽어오는 것도 가능합니다. pd.read_csv 함수를 사용할 때 encoding 매개변수를 지정하여 데이터를 읽어올 수 있습니다.

# CSV 파일에서 데이터프레임으로 읽어오기 (EUC-KR로 인코딩)
df = pd.read_csv('data.csv', encoding='euc-kr')

이렇게 판다스를 사용하여 데이터프레임을 특정 인코딩으로 저장하거나 읽어올 수 있습니다.

더 많은 정보를 원하신다면 아래 공식 문서를 참고해주세요.