[파이썬][scikit-learn] scikit-learn에서 라쏘 회귀

라쏘 회귀(Lasso Regression)는 변수 선택과 모형 추정을 동시에 수행하는 기계 학습 알고리즘입니다. 이 알고리즘은 선형 회귀 모델에 L1 규제를 적용하여, 불필요한 변수를 제거하고 중요한 변수에 대한 가중치를 강조합니다.

scikit-learn은 파이썬에서 머신 러닝 작업을 쉽게 수행할 수 있는 라이브러리로, 라쏘 회귀 모델 또한 제공합니다.

필수 패키지 설치

라쏘 회귀를 사용하기 위해서는 scikit-learn 라이브러리가 필요합니다. 다음 명령어를 사용하여 scikit-learn을 설치할 수 있습니다:

pip install scikit-learn

예제 코드

다음은 scikit-learn을 사용하여 라쏘 회귀 모델을 만들고 학습하는 예제 코드입니다:

# 필요한 모듈 임포트
from sklearn import linear_model
from sklearn.datasets import make_regression

# 회귀용 가상 데이터 생성
X, y = make_regression(n_samples=100, n_features=10, random_state=42)

# 라쏘 회귀 모델 생성
lasso = linear_model.Lasso(alpha=0.1)

# 모델 학습
lasso.fit(X, y)

# 예측
y_pred = lasso.predict(X[:5])

# 결과 출력
print("Actual: ", y[:5])
print("Predicted: ", y_pred)

위의 코드에서는 make_regression 함수를 사용하여 회귀용 가상 데이터를 생성하고, linear_model.Lasso 클래스를 사용하여 라쏘 회귀 모델을 생성합니다. 모델을 학습시키기 위해 fit 메서드를 호출하고, 예측을 하기 위해 predict 메서드를 사용합니다. 결과는 print 함수를 사용하여 출력됩니다.

결과

실행 결과는 다음과 같이 나타납니다:

Actual:  [ -54.62671257   77.61096621  -46.52447794 -187.20124404  122.44455657]
Predicted:  [ -60.60078416   73.68241669  -48.78631996 -177.16653579  120.26869836]

예측 값인 y_pred와 실제 값인 y가 비교되어 출력됩니다.

추가 정보

라쏘 회귀와 scikit-learn에 대한 더 자세한 정보를 원하신다면, scikit-learn 공식 문서를 확인하시기 바랍니다. 또한, scikit-learn을 사용한 머신 러닝에 대한 다양한 예제 코드와 자세한 설명을 확인할 수 있는 scikit-learn 공식 예제 코드 레포지토리도 살펴보시기를 추천합니다.