머신러닝 분류 평가 지표
1. Confusion_matrix
앞글자 : 예측 성공 판단
뒷글자 : 예측값
- TN (True Negative) : 실제 False인 정답을 False라고 예측 (정답)
- FP (False Positive) : 실제 False인 정답을 True라고 예측 (오답)
- FN (False Negative) : 실제 True인 정답을 False라고 예측 (오답)
- TP (True Positive) : 실제 True인 정답을 True라고 예측 (정답)
- 정확도 (Accuracy) : 전체 중에 정확히 맞춘 비율
불균형한 데이터가 들어있을 경우 정확도로 성능을 평가하는 것은 문제가 됨
- 재현율 (Recall) : 실제 양성 중에 예측 양성 비율
실제 positive(양성)인 데이터 예측을 Negative(음성)으로 잘못 판단하게 되면 업무상 큰 영향을 줌
(ex : 암진단, 금융사기 판별, 도둑 판별 등)
- 정밀도 (Precision) : 예측 양성 중에 실제 양성 비율
실제 Negative(음성)인 데이터 예측을 Positive(양성)으로 잘못 판단하게 되면 업무상 큰 영향을 줌
(ex : 스팸메일, 어린아이 제공 영상 등)
- F1-score : 정밀도와 재현율의 조화평균
'Machine Learning' 카테고리의 다른 글
머신러닝 앙상블(Ensemble) (0) | 2023.03.20 |
---|---|
머신러닝 Decision Tree, 교차 검증, 특성 선택 (0) | 2023.03.20 |
머신러닝 기초 3, KNN모델을 이용한 붓꽃 품종 분류 실습 (0) | 2023.03.12 |
머신러닝 기초 2, 비만도 데이터 이용 학습 (0) | 2023.03.11 |
머신러닝 기초 1, and/xor 연산 (1) | 2023.03.11 |
댓글