机器学习评价指标 本文针对二元分类器

机器学习:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线

在介绍指标前必须先了解“混淆矩阵”:

混淆矩阵

True Positive(真正,TP):将正类预测为正类数,是正的,也预测正的

True Negative(真负,TN):将负类预测为负类数,是负的,也预测负的

False Positive(假正,FP):将负类预测为正类数误报 (Type I error),是负的,预测为正的

False Negative(假负,FN):将正类预测为负类数→漏报 (Type II error),是正的,预测为负的

这里写图片描述

这里写图片描述

1、准确率(Accuracy)

分子:正正+负负

分母:正负+负正+正正+负负

准确率(accuracy)计算公式为:
这里写图片描述

2、错误率(Error rate)

分子:负正+正负

分母:所有

错误率则与准确率相反,描述被分类器错分的比例,error rate = (FP+FN)/(TP+TN+FP+FN),对某一个实例来说,分对与分错是互斥事件,所以accuracy =1 - error rate。

3、灵敏度(sensitive)、召回率

分子:正正,

分母:正正+正负

sensitive = TP/P,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力。

4、特效度(sensitive)

分子:负负

分母:负负+负正

specificity = TN/N,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力。

5、精确率、精度(Precision)

分子:正正

分母:正正+负正

精确率(precision)定义为:
这里写图片描述

表示被分为正例的示例中实际为正例的比例。

原文地址:https://www.cnblogs.com/vivianzy1985/p/9209150.html