机器学习模型评估指标

(原创)

机器学习模型指标小记:

以预测疾病为例,预测病人是否患病或健康。正向:病人,反向:健康

TP:正向预测正确,即病人被预测为病人

FP:反向预测错误,即健康被预测为疾病

FN:正向预测错误,即病人被预测为健康

TN:反向预测正确,即健康被预测为健康

recall(召回,又叫hit rate,sensitivity,true positive rate(TPR)):

        TP/(TP+FN) ,正向预测准的,占所有正向人员的比例,

        即预测到的病人数占总真实病人数的比例

false postive rate(FPR)

         FP/(FP+TN) , 反向预测错误的,占所有反向人员的比例

         即预测为病人的健康人,占所有健康人的比例。

precision

          TP/(TP+FP), 正向预测准的,占所有预测正向数的比例

          即预测准的病人数占总预测病人数的比例

accuracy

          (TP+TN) /(TP+FP+TN+FN) ,  全部预测准的,占总数的比例

          即预测准的病人和预测准的健康人,占所有人比例

F1 分数: recall 和 precision 的调和平均

ROC 曲线:横轴为FPR,纵轴为recall

AUC: area under curve,ROC曲线下的面积

原文地址:https://www.cnblogs.com/randomstring/p/10426226.html