[python] scikit-learn을 이용한 선형 회귀 시각화

이전 포스트에서 배운 선형 회귀를 시각화하는 방법에 대해 알아보겠습니다. 이를 위해 scikit-learn 라이브러리를 활용하여 선형 회귀 모델을 생성하고 시각화하는 과정을 다루겠습니다.

1. 필요한 라이브러리 임포트하기

import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

우선 선형 회귀 모델을 생성하고 시각화하기 위해 필요한 numpy, scikit-learn, matplotlib.pyplot 모듈을 임포트합니다.

2. 데이터 준비하기

# 랜덤한 데이터 생성
np.random.seed(0)
X = np.random.rand(100, 1)
y = 2 + 3 * X + np.random.randn(100, 1)

데이터를 준비하기 위해 numpy.random.rand 함수를 사용하여 랜덤한 X 값을 생성하고, 그에 따른 y 값을 계산합니다.

3. 선형 회귀 모델 생성하기

# 선형 회귀 모델 생성
model = LinearRegression()
model.fit(X, y)

scikit-learn의 LinearRegression 클래스를 사용하여 선형 회귀 모델을 생성하고, fit 메서드를 통해 데이터를 학습시킵니다.

4. 시각화하기

# 데이터 시각화
plt.scatter(X, y, s=10)
plt.plot(X, model.predict(X), color='r')
plt.xlabel('X')
plt.ylabel('y')
plt.show()

데이터를 산점도로 표시한 후, 생성한 선형 회귀 모델의 예측값을 선으로 표시합니다. X축과 y축에 라벨을 지정하고, 시각화 결과를 표시합니다.

5. 실행 결과

linear_regression_visualization

위의 실행 코드를 실행하면, 선형 회귀 모델을 시각화한 결과를 얻을 수 있습니다.

참고 자료