[python] 파이썬 pandas에서 데이터를 결측치 처리하는 방법은 무엇인가요?
1. 결측치 확인
import pandas as pd
# 데이터프레임 생성
df = pd.DataFrame({'A': [1, 2, None, 4, 5], 'B': [None, 2, 3, 4, 5]})
# 결측치 확인
print(df.isnull())
결과:
A B
0 False True
1 False False
2 True False
3 False False
4 False False
2. 결측치 대체
# 평균값으로 결측치 대체
df_filled = df.fillna(df.mean())
print(df_filled)
결과:
A B
0 1.0 3.5
1 2.0 2.0
2 3.0 3.0
3 4.0 4.0
4 5.0 5.0
3. 결측치 제거
# 결측치가 있는 행 제거
df_dropped = df.dropna()
print(df_dropped)
결과:
A B
1 2.0 2.0
3 4.0 4.0
4 5.0 5.0
이것은 pandas에서 결측치를 처리하는 일부 기본적인 방법들이며, 데이터에 따라 다양한 경우에 적용될 수 있습니다. 더 많은 처리 방법에 대해서는 pandas 공식 문서를 참고하세요.