[파이썬] 파이썬을 이용한 지도 학습 샘플 프로젝트
지도 학습은 기계 학습의 주요 분야 중 하나로, 주어진 입력 데이터와 정답 데이터를 활용하여 모델을 학습시키는 방법입니다. 파이썬은 다양한 머신러닝 라이브러리를 제공하며, 이를 활용하여 지도 학습 프로젝트를 구현할 수 있습니다.
이번 글에서는 파이썬을 이용하여 지도 학습을 위한 샘플 프로젝트를 구현하는 방법에 대해 알아보겠습니다. 이 프로젝트에서는 붓꽃 데이터셋을 사용하여 붓꽃의 품종을 예측하는 모델을 만들어보겠습니다.
1. 데이터셋 불러오기
먼저, 필요한 패키지와 데이터셋을 불러와야 합니다. 이번 프로젝트에서는 scikit-learn
패키지를 사용하겠습니다.
import pandas as pd
from sklearn.datasets import load_iris
# 붓꽃 데이터셋 불러오기
iris = load_iris()
# 입력 데이터
X = iris.data
# 정답 데이터
y = iris.target
2. 데이터 전처리
불러온 데이터를 적절하게 가공해주어야 합니다. 이번 프로젝트에서는 간단하게 데이터를 분할하겠습니다. 80%의 데이터를 학습 데이터로 사용하고, 20%의 데이터를 테스트 데이터로 사용하겠습니다.
from sklearn.model_selection import train_test_split
# 데이터 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
3. 모델 학습
학습 데이터를 이용하여 모델을 학습시킬 수 있습니다. 이번 프로젝트에서는 DecisionTreeClassifier
모델을 사용하겠습니다.
from sklearn.tree import DecisionTreeClassifier
# 모델 생성 및 학습
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
4. 예측 및 평가
학습된 모델을 사용하여 새로운 데이터에 대한 예측을 수행할 수 있습니다. 또한, 모델의 성능을 평가하기 위해 테스트 데이터를 사용할 수 있습니다.
# 예측
y_pred = model.predict(X_test)
# 평가
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
결론
파이썬을 이용하여 지도 학습 샘플 프로젝트를 구현해보았습니다. 이 프로젝트를 통해 데이터셋을 불러오고, 데이터를 전처리하며, 모델을 학습시키고, 예측 및 평가하는 과정을 경험할 수 있었습니다. 파이썬의 다양한 머신러닝 라이브러리를 활용하여 다양한 지도 학습 프로젝트를 구현해보세요!