[python] scikit-learn을 이용한 모델 예측 결과 시각화

01 Dec 2023

python

scikit-learn은 파이썬에서 머신러닝과 데이터 분석을 위한 강력한 라이브러리입니다. 이 라이브러리를 사용하면 다양한 머신러닝 모델을 훈련하고 예측할 수 있습니다. 하지만 모델의 예측 결과를 시각화하여 쉽게 이해하기 위해서는 추가적인 작업이 필요합니다. 이번 글에서는 scikit-learn을 사용하여 훈련한 모델의 예측 결과를 시각화하는 방법에 대해 알아보겠습니다.

필요한 패키지 설치

먼저 필요한 패키지를 설치해야 합니다. 아래의 명령어를 사용하여 필요한 패키지를 설치하세요.

pip install scikit-learn matplotlib

예측 결과 시각화

다음은 scikit-learn을 사용하여 훈련한 모델의 예측 결과를 시각화하는 예제입니다.

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score

# 데이터셋 로드
diabetes = datasets.load_diabetes()

# 특징 변수와 타겟 변수 설정
X = diabetes.data[:, np.newaxis, 2]
y = diabetes.target

# 데이터 분할
X_train = X[:-20]
X_test = X[-20:]
y_train = y[:-20]
y_test = y[-20:]

# 선형 회귀 모델 훈련
regr = linear_model.LinearRegression()
regr.fit(X_train, y_train)

# 예측 수행
y_pred = regr.predict(X_test)

# 결과 시각화
plt.scatter(X_test, y_test,  color='black')
plt.plot(X_test, y_pred, color='blue', linewidth=3)

plt.xlabel('Feature')
plt.ylabel('Target')

plt.show()

위의 예제에서는 diabetes 데이터셋을 사용하여 선형 회귀 모델을 훈련하고, 예측 결과를 시각화합니다.

먼저 데이터셋을 로드하고 특징 변수와 타겟 변수를 설정합니다. 그리고 데이터를 훈련 데이터와 테스트 데이터로 분할합니다.

이후 선형 회귀 모델을 훈련시키고, 테스트 데이터에 대한 예측을 수행합니다. 이 결과를 scatter plot과 함께 선 그래프로 시각화하여 실제 값과 예측 값의 비교를 할 수 있습니다.

예측 결과를 시각화하여 모델의 성능을 파악하는 것은 모델 개선에 큰 도움이 됩니다. scikit-learn을 사용하면 간단하게 예측 결과를 시각화할 수 있으며, 이를 통해 모델의 성능을 평가하고 개선할 수 있습니다.

더 많은 시각화 기법을 사용하여 모델의 예측 결과를 분석하고 개선할 수도 있습니다. scikit-learn의 다른 모델 및 시각화 기법을 적용해보면서 데이터 분석 및 머신러닝에 대한 이해를 높여보세요!

필요한 패키지 설치

예측 결과 시각화

참고 자료