分类任务评价——混淆矩阵、精度、召回率的具体解释

混淆矩阵:

  混淆矩阵的正例一般是我们需要关注的,常用1表示,反例是我们不关注的,常用0表示。例如:一个需要识别借贷需求的人的分类任务中,正例表示有借贷需求的人,反例表示没有借贷需求的人。下面定义一些基于混淆矩阵的度量分类任务的方法:

查准率(Precision):

基于这个借贷需求识别任务说明:所有识别出来的正例中真实正例的占比,越高越好。

召回率(Rcall):

基于这个借贷需求识别任务说明:所识别出来的正例在在实际正例中的占比,越高越好。

  当然TP越高,二者都高。但是现实中这两个一般一个高,另一个就低。在借贷需求识别任务中识别出的正例会交给电话销售,如果电话销售成本高,我们当然希望识别出的正例中真实正例越高越好,即优先保证查全率高;如果电话销售的成本低,那么有限保证召回率高。

F1度量:

 

 

 

原文地址:https://www.cnblogs.com/wzdLY/p/9630418.html