特征词选择算法对文本分类准确率的影响(三)

08-17 19:26

特征词选择算法对文本分类准确率的影响(二)

特征词选择算法对文本分类准确率的影响(一)

本节的题目是:是不是特征词的数目越高?VSM模型的特征维数越高,分类的准确率越高呢?

很多人会想当然地认为应该是VSM模型的维数越高,也即所选的特征词数目越多,分类准确率越高。但答案是否定的。我们看下面的这张图就知道了。





从上面的图片我们可以看到当文档集规模》2000时(red line,green line cyan line),(我实验的文档规模分别为200,1000,2000,3000),准确率随着特征维数的增加呈现平稳递减的趋势

原文地址:https://www.cnblogs.com/finallyliuyu/p/1812919.html