机器学习分类模型评价指标和方法

一、ROC曲线:

1、混淆矩阵:

针对二元分类问题,将实例分为正类或者负类,会出现四种情况:

(1)实例本身为正类,被预测为正类,即真正类(TP);

(2)实例本身为正类,被预测为负类,即假负类(FN);

(3)实例本身为负类,被预测为正类,即假正类(FP);

(4)实例本身为负类,被预测为负类,即真负类(TN);

然后可以构建混淆矩阵,如下表所示:

(1)准确率(又称查准率)Precision,  P=TP/(TP+FP)

(2)召回率(又称查全率)Recall,  R=TP/(TP+FN)

(3)F1-Score,F1=2PR/(P+R)

recall 体现了分类模型对正样本的识别能力,recall 越高,说明模型对正样本的识别能力越强;

precision 体现了模型对负样本的区分能力,precision越高,说明模型对负样本的区分能力越强;

F1-score 是两者的综合,F1-score 越高,说明分类模型越稳健。

原文地址:https://www.cnblogs.com/hester-tang/p/8808941.html