[python] Pandas의 데이터 타입 변환

Pandas는 데이터를 다루는 데 유용한 도구입니다. 데이터를 불러오거나 생성할 때, 종종 데이터의 타입을 변환해야 하는 경우가 있습니다. 이 글에서는 Pandas를 사용하여 데이터의 타입을 변환하는 방법에 대해 알아보겠습니다.

1. 데이터프레임 생성

우선, 예제를 위해 임의의 데이터프레임을 생성해보겠습니다.

import pandas as pd

data = {'A': [1, 2, 3], 'B': [4.0, 5.0, 6.0], 'C': ['7', '8', '9']}
df = pd.DataFrame(data)

생성된 데이터프레임의 각 열에는 정수, 부동소수점, 문자열이 혼합되어 있습니다.

2. 데이터 타입 확인

먼저 데이터프레임의 각 열의 데이터 타입을 확인해보겠습니다.

print(df.dtypes)

위 코드를 실행하면 각 열의 데이터 타입이 출력됩니다.

3. 데이터 타입 변환

3.1. 숫자형으로 변환

정수형이 아닌 열을 정수형으로 변환하려면 astype 메서드를 사용합니다.

df['C'] = df['C'].astype(int)

3.2. 부동소수점형으로 변환

정수형이 아닌 열을 부동소수점형으로 변환하려면 마찬가지로 astype 메서드를 사용합니다.

df['A'] = df['A'].astype(float)

3.3. 문자열로 변환

반대로, 숫자형으로 되어 있는 열을 문자열로 변환하려면 astype 메서드 대신 astype(str)을 사용합니다.

df['B'] = df['B'].astype(str)

4. 변환된 데이터프레임 확인

변환된 데이터프레임의 각 열의 데이터 타입을 다시 확인해봅시다.

print(df.dtypes)

위 코드를 실행하면 각 열의 변환된 데이터 타입이 출력됩니다.

이제 Pandas를 사용하여 데이터프레임의 데이터 타입을 변환하는 방법에 대해 알게 되었습니다. 데이터를 다룰 때 필요에 따라 데이터 타입을 적절히 변환하여 원하는 작업을 수행할 수 있습니다.

참고자료