近期工作安排

目前参与到了实验室的某一个项目中的子需求中。这个子需求可以归结为一个文本分类问题,但是对文本分类精度的要求非常高。所有考虑做如下工作:

1。 程序中实现KNN分类器或者多项式朴素贝叶斯分类器。(调用weka的分类器不太方便,还是自己直接写。毕竟这是做工程,而不是做“实验”)

目前已经完成了KNN分类器

2。考虑用bagging或者boosting的方法加强基本分类器的性能。或者通俗点说是用“串联”或者“并联”分类器的方法,提供分类性能。

3。考虑用半监督学习方法中的“使用朴素贝叶斯分类器的EM算法”来提供分类性能。

真想做个实验,看看1,2,3那种方法更好,就是不知道boss是不是会不给我时间,只是草草地完成工程就OK了。

原文地址:https://www.cnblogs.com/finallyliuyu/p/1836017.html