[python] 재현율(Recall)
재현율은 머신러닝 모델의 분류 성능을 평가하는 지표 중 하나입니다. 재현율은 실제 Positive인 샘플 중에서 모델이 정확히 Positive로 예측한 비율을 나타냅니다.
재현율은 거짓 음성(FN : False Negative)의 수를 최소화하는 것이 중요한 경우에 사용됩니다. 예를 들어 암 진단 모델의 경우, 거짓 음성을 최소화해야 실제로 암이 있는 환자를 놓치지 않을 수 있습니다.
수식으로 나타내면 다음과 같습니다.
Recall = TP / (TP + FN)
여기서 TP는 True Positive, FN은 False Negative를 의미합니다.
재현율은 모델의 민감도(sensitivity), 탐지율(detection rate) 또는 진양성 비율(true positive rate)로도 불립니다.
모델의 재현율이 높을수록 실제 Positive인 샘플을 잘 탐지하는 것이므로, 재현율을 개선하기 위해 다양한 전처리 기법, 모델 설계 등을 고려할 수 있습니다.
[참고 자료]