[python] 파이썬 pandas에서 데이터를 결측치 처리하는 방법은 무엇인가요?

1. 결측치 확인

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'A': [1, 2, None, 4, 5], 'B': [None, 2, 3, 4, 5]})

# 결측치 확인
print(df.isnull())

결과:

       A      B
0  False  True
1  False  False
2  True   False
3  False  False
4  False  False

2. 결측치 대체

# 평균값으로 결측치 대체
df_filled = df.fillna(df.mean())
print(df_filled)

결과:

     A    B
0  1.0  3.5
1  2.0  2.0
2  3.0  3.0
3  4.0  4.0
4  5.0  5.0

3. 결측치 제거

# 결측치가 있는 행 제거
df_dropped = df.dropna()
print(df_dropped)

결과:

     A    B
1  2.0  2.0
3  4.0  4.0
4  5.0  5.0

이것은 pandas에서 결측치를 처리하는 일부 기본적인 방법들이며, 데이터에 따라 다양한 경우에 적용될 수 있습니다. 더 많은 처리 방법에 대해서는 pandas 공식 문서를 참고하세요.