Efficient Vector Representation for Documents through Corruption-by Minmin Chen阅读

关键词: 词向量、文档向量、文档表示

 地址:https://openreview.net/forum?id=B1Igu2ogg&noteId=B1Igu2ogg

首先,论文解决的是Word2Vec,Paragraph Vectors一样的,文档表示形式的问题。提出了叫做Doc2VecC的方法。如何来表示一个文档,从而进行相关的文档分类,语义理解,感情分析。。。

这里给出一个参考链接, 理解Word2Vec的。http://blog.csdn.net/a819825294/article/details/52438625

然后,和其他方法不同的是,这里直接用文档中所有的词向量的平均来代表文档的向量表达,还有用到了随机的替换文档中的词语,这个不理解意义在哪?没有读懂。

最后给出了好多实验,效果比已有的算法比如Word2Veec都要好。

每天分享一点计算机和软件工程考研的知识点到微信公众号: cs2kaoyan 希望能对一些朋友有帮助~
原文地址:https://www.cnblogs.com/robin2ML/p/6669654.html