基于gensim深入自然语言处理

2018.01.26

一、如何使用gesim

1、几个关键术语

Corpus:语料,包括最原始的文章、词袋、以及词向量,

Vector:向量,包括词袋,tfidf向量、Lsi向量、Lda向量

model:转化器,tfidf、lai、lda将语料从一种向量转化为量外一种向量,目的是为了用更少的空间,更有效的表征文章的含义

一、如何使用gesim

1、几个关键术语

Corpus:语料,包括最原始的文章、词袋、以及词向量,

Vector:向量,包括词袋,tfidf向量、Lsi向量、Lda向量

model:转化器,tfidf、lai、lda将语料从一种向量转化为量外一种向量,目的是为了用更少的空间,更有效的表征文章的含义

nlp网站

http://www.hankcs.com/nlp/ 讲解分词、词性标注、

word2vec和fasttext比较

原文地址:https://www.cnblogs.com/lxw003/p/8360348.html