[python] scikit-learn을 이용한 선형 회귀 시각화
이전 포스트에서 배운 선형 회귀를 시각화하는 방법에 대해 알아보겠습니다. 이를 위해 scikit-learn 라이브러리를 활용하여 선형 회귀 모델을 생성하고 시각화하는 과정을 다루겠습니다.
1. 필요한 라이브러리 임포트하기
import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
우선 선형 회귀 모델을 생성하고 시각화하기 위해 필요한 numpy, scikit-learn, matplotlib.pyplot 모듈을 임포트합니다.
2. 데이터 준비하기
# 랜덤한 데이터 생성
np.random.seed(0)
X = np.random.rand(100, 1)
y = 2 + 3 * X + np.random.randn(100, 1)
데이터를 준비하기 위해 numpy.random.rand 함수를 사용하여 랜덤한 X 값을 생성하고, 그에 따른 y 값을 계산합니다.
3. 선형 회귀 모델 생성하기
# 선형 회귀 모델 생성
model = LinearRegression()
model.fit(X, y)
scikit-learn의 LinearRegression 클래스를 사용하여 선형 회귀 모델을 생성하고, fit 메서드를 통해 데이터를 학습시킵니다.
4. 시각화하기
# 데이터 시각화
plt.scatter(X, y, s=10)
plt.plot(X, model.predict(X), color='r')
plt.xlabel('X')
plt.ylabel('y')
plt.show()
데이터를 산점도로 표시한 후, 생성한 선형 회귀 모델의 예측값을 선으로 표시합니다. X축과 y축에 라벨을 지정하고, 시각화 결과를 표시합니다.
5. 실행 결과
위의 실행 코드를 실행하면, 선형 회귀 모델을 시각화한 결과를 얻을 수 있습니다.