性能指标

对于二分类问题

混淆矩阵####

TP(真正例):将正类预测为正类
FN(假反例):将正类预测为负类
FP(假正例): 将负类预测为正类
TN(真反例): 将负类预测为负类
这么看,可能有点头晕,换个角度:

  • 第一个字母(T or F):表示预测值与真实值是否一致,一致的话为T,否则为F
  • 第二个字母(P or N):表示预测值为正(T)或者负(P)

三个常用指标

  • 查准率:

[P = frac{TP}{TP+FP} ]

即在所有预测为正的样本里面真实值为正样本所占的比例

  • 召回率:

[R=frac{TP}{TP+FN} ]

FN样本的真实标签其实为正,故分母为所有真实值为正的样本数, 即该公式表示:
所有真实值为正的样本中预测值也为正的样本数

  • F1值

[F_{1}=frac{2}{frac{1}{P}+frac{1}{R}} ]

P与R的调和均值,综合衡量的查准率与召回率

mAP####

目标检测中衡量识别精度的指标是mAP(mean average precision)。多个类别物体检测中,每一个类别都可以根据recall和precision绘制一条P-R曲线,AP就是该曲线下的面积,mAP是多个类别AP的平均值。
而P-R曲线是如何绘制的呢?
检测器输出每个检测结果都会对应一个detect confidence,我们会人为设定一个confidence阈值,如果检测结果高于confidence阈值,那预测该检测为正样本,否则为预测为负。
显然,阈值设置越高,则查准率P越高,但相应召回率R就越底,我们可以通过设置不同的阈值得到P-R曲线。

[ref] (http://blog.csdn.net/a1154761720/article/details/50864994)

原文地址:https://www.cnblogs.com/fariver/p/6675181.html