[python] 파이썬 pandas에서 데이터를 정규화하는 방법은 무엇인가요?
from sklearn.preprocessing import MinMaxScaler
import pandas as pd

# 데이터 프레임 생성
data = {'value': [5, 10, 15, 20, 25]}
df = pd.DataFrame(data)

# Min-Max 정규화
scaler = MinMaxScaler()
df['normalized_value'] = scaler.fit_transform(df[['value']])

print(df)

이 코드는 MinMaxScaler를 사용하여 데이터를 0과 1 사이의 값으로 정규화합니다.

또 다른 방법으로는 Z 점수 정규화(Standardization)가 있습니다. 이 방법은 데이터의 평균을 0으로, 표준편차를 1로 만들어 정규화하는 방법입니다. 판다스에서 이를 적용하려면 다음과 같이 할 수 있습니다:

from sklearn.preprocessing import StandardScaler
import pandas as pd

# 데이터 프레임 생성
data = {'value': [5, 10, 15, 20, 25]}
df = pd.DataFrame(data)

# Z 점수 정규화
scaler = StandardScaler()
df['standardized_value'] = scaler.fit_transform(df[['value']])

print(df)

이렇게 하면 데이터가 평균이 0이고 표준편차가 1인 값으로 정규화됩니다.

[출처]