[python] Pandas의 데이터 타입 변환
Pandas는 데이터를 다루는 데 유용한 도구입니다. 데이터를 불러오거나 생성할 때, 종종 데이터의 타입을 변환해야 하는 경우가 있습니다. 이 글에서는 Pandas를 사용하여 데이터의 타입을 변환하는 방법에 대해 알아보겠습니다.
1. 데이터프레임 생성
우선, 예제를 위해 임의의 데이터프레임을 생성해보겠습니다.
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4.0, 5.0, 6.0], 'C': ['7', '8', '9']}
df = pd.DataFrame(data)
생성된 데이터프레임의 각 열에는 정수, 부동소수점, 문자열이 혼합되어 있습니다.
2. 데이터 타입 확인
먼저 데이터프레임의 각 열의 데이터 타입을 확인해보겠습니다.
print(df.dtypes)
위 코드를 실행하면 각 열의 데이터 타입이 출력됩니다.
3. 데이터 타입 변환
3.1. 숫자형으로 변환
정수형이 아닌 열을 정수형으로 변환하려면 astype
메서드를 사용합니다.
df['C'] = df['C'].astype(int)
3.2. 부동소수점형으로 변환
정수형이 아닌 열을 부동소수점형으로 변환하려면 마찬가지로 astype
메서드를 사용합니다.
df['A'] = df['A'].astype(float)
3.3. 문자열로 변환
반대로, 숫자형으로 되어 있는 열을 문자열로 변환하려면 astype
메서드 대신 astype(str)
을 사용합니다.
df['B'] = df['B'].astype(str)
4. 변환된 데이터프레임 확인
변환된 데이터프레임의 각 열의 데이터 타입을 다시 확인해봅시다.
print(df.dtypes)
위 코드를 실행하면 각 열의 변환된 데이터 타입이 출력됩니다.
이제 Pandas를 사용하여 데이터프레임의 데이터 타입을 변환하는 방법에 대해 알게 되었습니다. 데이터를 다룰 때 필요에 따라 데이터 타입을 적절히 변환하여 원하는 작업을 수행할 수 있습니다.
참고자료
- Pandas Documentation: Data types
- Stack Overflow: How to change data type of one column in a DataFrame?