新闻分类-文本向量化

  模型进行的是数学运算,因此需要数值类型的数据,而文本不是数值类型数据。 模型需要结构化数据,而文本是非结构化数据。将文本转换为数值特征向量的过程,称为文本向量化。将文本向量化可以分为如下步骤:

1.对文本分词, 拆分成更容处理的单词。
2.将单词转换为数值类型, 即使用合适的数值来表示每个单词。

此过程便是将文本的非结构化数据转化为结构化数据
原文地址:https://www.cnblogs.com/ICDTAD/p/14941397.html