混淆矩阵

混淆矩阵(Confusion Matrix)

混淆矩阵是一个列表,里面包含了实际值和判断值的情况。下图是信息更加丰富的一张混淆矩阵图:

作为良好的学习模型,TN和TP值是高的,FP和FN值=0;但是很多场景下FP和FN都不是0,那么怎么评价个分类学习的效果(performance)呢?

Accuracy:全准率

(TP+TN)/total = (100+50)/165 = 0.91

Misclassification Rate:差错率

(FP+FN)/total = (10+5)/165 = 0.09,其实A+M=1(互补)

True Positive Rate(TPR):查全率(Recall),对于实际是yes的case,识别出来的占所有的yes的比重

TP/actual yes = 100/105 = 0.95

False Positive Rate(FPR):对于false的case,未识别出来的概率

FP/actual no = 10/60 = 0.17

Specificity:特异性,对于false的case,识别出来的概率

TN/actual no = 50/60 = 0.83

注意,和上面的FPR互补

Precision:准确率,对于yes的case,识别出来概率

TP/predicted yes = 100/110 = 0.91

 

参考

https://www.dataschool.io/simple-guide-to-confusion-matrix-terminology/

原文地址:https://www.cnblogs.com/xiashiwendao/p/9326191.html