准确率和召回率

准确率和召回率

本来我开始以为准确率召回率这种东西不用记得太详细,用到的时候随手百度一下就行。但尝试搜了几篇文章评论区都有指正错误。正好手上有纸质书籍,遂决定码一码。

1.应用背景

在分类预测的机器学习任务中,样板实际类别数量可能是极不平衡的。例如,生产线上劣质产品识别,假如良品率有99%,而劣质产品只占1%。如果模型预测得到的良品率是80%,虽然纸面上的准确率很高,但是事实并非如此。

针对上述情况,准确率和召回率的定义就来了。

2.确切定义

混淆矩阵

预测为1 预测为0
实际为1 f11(TP) f10(FN)
实际为0 f01(FP) f00(TN)

召回率recall:

[Recall = frac{TP}{TP+FN} ]

描述:$$召回率=frac{正样本预测正确数}{实际正样本数}$$

准确率 Accuracy:

[Accuracy = frac{TP+TN}{TP+TN+FP+FN} ]

描述:$$准确率=frac{预测正确数}{样本总数}$$

精度Precision:

[Precision = frac{TP}{TP+FP} ]

描述:$$查准率=frac{正样本预测正确数}{正样本预测数}$$

书本原文:

3.知识扩展

准确率和查准率是一种模型评价度量。除此外还有F1度量(精度和召回率的调和平均数)、Fβ、ROC曲线等。

解决数据集不平衡分类任务得方法有代价敏感学习,不充分抽样/过分抽样。

原文地址:https://www.cnblogs.com/kang-mei-208/p/14591948.html