计算文本相似度方法总结(二)

总览

1.基于语料库

(1)词袋模型

VSM

LSA

PLSA

LDA

(2)神经网络

(3)搜索引擎

2.基于字符串

(1)基于字符

(2)基于词语

3.基于世界知识

(1)基于本体

(2)基于网络知识

4.其他方法

(1)句法分析

(2)混合方式

参考文献:

【1】文本相似度计算方法研究综述 Review of Studies on Text Similarity Measures

原文地址:https://www.cnblogs.com/nxf-rabbit75/p/10869402.html