【转】自然语言处理P,R,F值的计算公式

http://blog.csdn.net/wen718/article/details/5960666

在对汉语分词性能进行评估时,采用了常用的3个评测指标:准确率(P)、召回率(R)、综合指标F值(F)。准确率表示在切分的全部词语中,正确的所占的比值。召回率指在所有切分词语中(包括切分的和不应该忽略的),正确切分的词语所占的比值。准确率描述系统切分的词语中,正确的占多少。召回率表示应该得到的词语中,系统正确切分出了多少。计算公式如下:

P= 准确切分的词语数/切分出的所有词语数

R=准确切分的词语数/应该切分的词语数

实际评估一个系统时,应同时考虑P和R,但同时要比较两个数值,很难做到一目了然。所以常采用综合两个值进行评价的办法,综合指标F值就是其中一种。计算公式如下:

F=(β的平方+1)PR/(β的平方*P+R)

其中,β决定对P侧重还是对R侧重,通常设定为1、2或1/2。β取值为1,即对二者一样重视。

摘自《基于字的词位标注汉语分词》

原文地址:https://www.cnblogs.com/todoit/p/2466176.html