본문 바로가기
Machine Learning

머신러닝 분류 평가 지표

by wanttosleep1111 2023. 3. 12.

머신러닝 분류 평가 지표

 

1. Confusion_matrix

앞글자 : 예측 성공 판단
뒷글자 : 예측값 

  • TN (True Negative) : 실제 False인 정답을 False라고 예측 (정답)
  • FP (False Positive) : 실제 False인 정답을 True라고 예측 (오답)
  • FN (False Negative) : 실제 True인 정답을 False라고 예측 (오답)
  • TP (True Positive) : 실제 True인 정답을 True라고 예측 (정답)

 

  • 정확도 (Accuracy) : 전체 중에 정확히 맞춘 비율
    불균형한 데이터가 들어있을 경우 정확도로 성능을 평가하는 것은 문제가 됨

 

  • 재현율 (Recall) : 실제 양성 중에 예측 양성 비율
    실제 positive(양성)인 데이터 예측을 Negative(음성)으로 잘못 판단하게 되면 업무상 큰 영향을 줌
    (ex : 암진단, 금융사기 판별, 도둑 판별 등)

 

 

  • 정밀도 (Precision) : 예측 양성 중에 실제 양성 비율
    실제 Negative(음성)인 데이터 예측을 Positive(양성)으로 잘못 판단하게 되면 업무상 큰 영향을 줌
    (ex : 스팸메일, 어린아이 제공 영상 등)

 

 

  • F1-score : 정밀도와 재현율의 조화평균

댓글