机器学习的性能度量

1. 错误率和精度

  错误率 - 错误样本占总样本比例

  精度   -   正确样本占样本比例

2. 混淆矩阵

混淆矩阵的行代表的是实际类别,列代表的是预测的类别.

3. 查全率 、 查准率

查准率和查全率的重视程度有所不同。F1度量的一般形式,能让我们表达出对查准率/查全率的不同偏好,它定义为



  其中β>0度量了查全率对查准率的相对重要性。

  ①β=1  退化为标准的F1

  ②β>1  查全率有更大影响

  ③β<1  查准率有更大影响

P-R曲线的画法:将学习器的预测结果对样例进行排序,排在最前面的是学习器认为最可能的正例样本,按此顺序从前往后逐个把样本作为正例,逐次计算当前的查准率和查全率,绘制在图中即得到P-R曲线。

其他评价指标: 鲁棒性,计算速度 

4. ROC和AUC 

原文地址:https://www.cnblogs.com/geoffreyone/p/9997082.html