word2vec训练出来的相似词歧义

【问题】word2vec训练以后,得到预付卡和购物卡非常接近,可是实际上这两个东西是不一样的,如何区分这两个东西?

解决:建立一个独立词典,这个词典里的词是没有近义词的,独立的词,比如预付卡是很独特的,我们加进词典了,每次遇到这个词,我们就不是取TOPN 为1, 我们取topn为1.2,

这样就会实现:

【预付卡 设置】

【激活 预付卡】

的相似度,大于

【激活 预付卡】

【使用 购物卡】

的相似度

==================

这方法不好,本来word2vec训练出来的就应该是确实相似的结果,除非出现很大的问题,否则不要这样调整,对整体的准确率不好

原文地址:https://www.cnblogs.com/yjybupt/p/9953037.html