NLP----评价指标

文本生成评价指标

ROUGE(Recall-Oriented Understudy for Gisting Evaluation)是一组度量,用于比较自动生成的摘要或翻译与人类生成的参考摘要或翻译之间的相似性。ROUGE与BELU的区别是ROUGE只考虑召回率,即不关心翻译结果是否流畅,只关注翻译是否准确:候选翻译中包含多少参考译文中的n-gram。共包含如下5中评估度量: 参考

原文地址:https://www.cnblogs.com/z-712/p/14925795.html