舆情正负面判断
1、模型需求
- 考虑需要判断高校与纪委的舆情正负面,需构建三个模型A、B、C
-
[ ] 模型A:构建一个针对
高校
的正负面分类模型。 -
[ ] 模型B:构建一个针对
纪委
的正负面分类模型。 -
[ ] 模型C:构建一个区分
纪委和高校
的分类模型
如果后期有其他需求,如添加商品评价的正负面判断。则增加一个商品评价的正负面判断模型,并将模型C重新训练为一个三类分类器。
2、数据集收集
-
[ ] 数据集A: 收集
高校相关
的正负面舆情 (初始正负面各2W、再逐步扩增) -
[ ] 数据集B: 收集
纪委相关
的正负面舆情 (初始正负面各2W、再逐步扩增) -
[ ] 数据集C: 收集
高校和纪委
的舆情 (初始正负面各2W、再逐步扩增)
3、数据集标注
- [ ] 数据集A: 对舆情情感倾向的
正负面
分别标注为1、0
- [ ] 数据集B: 对舆情情感倾向的
正负面
分别标注为1、0
- [ ] 数据集C: 高校舆情,纪委舆情分别标注为
1、0
4、数据预处理
- 数据清洗
- 舆情数据长度的填充和截断
5、搭建模型
先上一个简单网络模型,看效果,再根据效果调整模型,确认最优模型。