[python] 파이썬 PyTorch에서 모델 성능을 평가하기 위한 지표는 무엇인가?

22 Nov 2023

일반적으로 주로 사용되는 성능 평가 지표는 다음과 같습니다:

정확도(Accuracy): 정확도는 모델이 정확하게 분류한 샘플의 비율입니다. 이는 다중클래스 분류 문제나 이진 분류 문제의 성능을 평가할 때 자주 사용됩니다.
정밀도(Precision)와 재현율(Recall): 이진 분류 문제에서는 정밀도와 재현율이 중요한 지표입니다. 정밀도는 양성으로 예측한 샘플 중 실제로 양성인 비율을 나타내며, 재현율은 실제 양성인 샘플 중 모델이 양성으로 예측한 비율을 나타냅니다.
F1 점수(F1-Score): F1 점수는 정밀도와 재현율의 조화 평균입니다. 이는 정밀도와 재현율이 모두 중요한 경우에 유용하게 사용됩니다.
ROC 곡선 및 AUC: 이진 분류 문제에서는 ROC 곡선과 AUC(Area Under Curve)가 성능 평가에 사용됩니다. ROC 곡선은 모델의 민감도와 특이도를 그래프로 나타내며, AUC는 ROC 곡선 아래의 면적을 나타냅니다.
손실(Loss): 모델의 손실 함수는 학습 과정에서 사용되는 지표로, 손실이 감소하는 것이 모델의 학습이 잘 되고 있다는 것을 시사합니다.

이외에도 특정 작업에 맞게 추가적인 성능 평가 지표를 사용할 수 있습니다. 예를 들어, 객체 감지 문제에서는 IoU(Intersection over Union) 지표를 사용하여 예측 바운딩 박스와 실제 바운딩 박스의 겹침 정도를 측정합니다.

PyTorch에서는 이러한 지표를 쉽게 계산할 수 있는 기능을 많이 제공하므로, 모델을 평가할 때 이러한 지표를 활용해 성능을 평가할 수 있습니다.

참고 문헌: