[파이썬][scikit-learn] scikit-learn 설치

05 Sep 2023

scikit learn

scikit-learn은 Python 기반의 머신러닝 라이브러리로, 사용하기 쉬운 API와 다양한 머신러닝 알고리즘을 제공하여 데이터 분석과 예측 모델링 작업을 간편하게 수행할 수 있게 해줍니다. scikit-learn은 사이킷런(Sklearn)이라고도 불리며, 고품질의 코드와 예제로 인해 학계와 산업계에서 널리 사용되고 있습니다.

scikit-learn 설치 방법

scikit-learn을 설치하는 가장 간단한 방법은 파이썬의 패키지 관리자인 pip를 사용하는 것입니다. pip를 사용하여 scikit-learn을 설치하려면 다음 명령어를 명령 프롬프트나 터미널에서 실행하세요:

pip install scikit-learn

위 명령어를 실행하면 인터넷 연결을 통해 최신 버전의 scikit-learn 패키지가 다운로드되고 설치됩니다.

scikit-learn 버전 확인

scikit-learn을 설치했다면, 현재 설치된 버전을 확인하는 것도 중요합니다. scikit-learn의 버전을 확인하는 방법은 아래와 같습니다:

import sklearn
print(sklearn.__version__)

위 코드를 실행하면 현재 설치된 scikit-learn의 버전이 출력됩니다.

scikit-learn 종속성 설치

scikit-learn은 다른 몇 가지 패키지에 의존하고 있습니다. 이러한 종속성을 설치해주어야 scikit-learn을 사용할 수 있습니다. scikit-learn에서 필요한 종속 패키지들은 다음과 같습니다:

NumPy
SciPy
Joblib

이러한 종속 패키지들은 일반적으로 scikit-learn과 함께 설치되지만, 버전 충돌 등의 이유로 혹시나 설치되어 있지 않다면, pip를 사용하여 설치할 수 있습니다.

pip install numpy scipy joblib

위 명령어를 통해 종속 패키지를 설치해주면, scikit-learn을 정상적으로 사용할 수 있습니다.

scikit-learn 설치 확인

scikit-learn 설치가 정상적으로 이루어졌는지 확인하기 위해 간단한 예제 코드를 실행해봅시다:

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

# 데이터셋 로드
iris = load_iris()

# 입력 특성과 출력 데이터 분할
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)

# 모델 학습
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X_train, y_train)

# 모델 예측
y_pred = model.predict(X_test)

# 정확도 출력
print("Accuracy:", model.score(X_test, y_test))

위 예제 코드는 scikit-learn의 붓꽃 데이터셋을 로드하고, k-최근접 이웃(KNN) 알고리즘을 사용하여 붓꽃 종류를 예측하는 예제입니다. 실행해보고 정확도가 출력되는지 확인해보세요.

이제 scikit-learn이 설치되어 있고 사용할 준비가 되었습니다. 추가적인 문제 및 공부를 위해서는 scikit-learn 공식 문서를 참고하시기 바랍니다.

Happy Machine Learning with scikit-learn!