Machine Learning
머신러닝 분류 평가 지표
wanttosleep1111
2023. 3. 12. 14:56
머신러닝 분류 평가 지표
1. Confusion_matrix
앞글자 : 예측 성공 판단
뒷글자 : 예측값
- TN (True Negative) : 실제 False인 정답을 False라고 예측 (정답)
- FP (False Positive) : 실제 False인 정답을 True라고 예측 (오답)
- FN (False Negative) : 실제 True인 정답을 False라고 예측 (오답)
- TP (True Positive) : 실제 True인 정답을 True라고 예측 (정답)

- 정확도 (Accuracy) : 전체 중에 정확히 맞춘 비율
불균형한 데이터가 들어있을 경우 정확도로 성능을 평가하는 것은 문제가 됨


- 재현율 (Recall) : 실제 양성 중에 예측 양성 비율
실제 positive(양성)인 데이터 예측을 Negative(음성)으로 잘못 판단하게 되면 업무상 큰 영향을 줌
(ex : 암진단, 금융사기 판별, 도둑 판별 등)


- 정밀도 (Precision) : 예측 양성 중에 실제 양성 비율
실제 Negative(음성)인 데이터 예측을 Positive(양성)으로 잘못 판단하게 되면 업무상 큰 영향을 줌
(ex : 스팸메일, 어린아이 제공 영상 등)


- F1-score : 정밀도와 재현율의 조화평균
