WEKA “Detailed Accuracy By Class”和“Confusion Matrix”含义

=== Summary ===（总结）

Correctly Classified Instances（正确分类的实例） 45 90 %

Incorrectly Classified Instances （错误分类的实例） 5 10 %

Kappa statistic（Kappa统计量）　 0.792

Mean absolute error(均值绝对误差) 　 0.1

Root mean squared error（均方根误差）　0.3162

Relative absolute error（相对绝对误差）　 20.7954 %

Root relative squared error（相对均方根误差） 62.4666 %

Coverage of cases (0.95 level) 90 %

Mean rel. region size (0.95 level) 50 %

Total Number of Instances（实验的实例总数） 50

第一行“Detailed Accuracy By Class”：

一个数据库有500个文档，其中有50个文档符合定义的问题。系统检索到75个文档，但是只有45个符合定义的问题。

1.TP Rate（真正元比率）:45/50=90%

2.FP Rate（假正元比率）:35/50=70%

3.Precision（精准度）:P=45/75=60%

4.Recall（查全率）:R=45/50=90%

5.F-Measure：是查准率和查全率的调和平均数

6.ROC Area:一般大于0.5，这个值越接近1，说明模型的诊断效果越好。这个值在0.5～0.7时有较低准确性，在0.7～0.9时有一定准确性，在0.9以上时有较高准确性。如果这个值等于0.5，说明诊断方法完全不起作用，无诊断价值，而小于0.5不符合真实情况，在实际中极少出现。

第二行：混淆矩阵“Confusion Matrix”

行：预测

列：真实