hanlp添加词典不起作用

不起作用的原因很多,这里列举几个

这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件          data下载地址https://pan.baidu.com/s/1o8Rri0y

1、没有删除custom文件夹下的所有bin文件

  当添加新词典后,没有删除原来自动生成的缓存词典,直接运行不成功。所以要删除这个文件

2、hanlp.properties中配置不对(注意这个文件的位置

·  root=D:/Project/public_sentiment_monitor/plugin/项目名字(hanlp2)/

3、字典文本类型utf-8

4、添加的词典还要添加到CustomDictionaryPath中      如:

CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt; 机构名词典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;data/dictionary/custom/my.txt

5、字典内的文本不要有空格

  如:我爱我 家 n 1

这里我爱我家不能断

测试程序:

        String text = "比妳聰明的人,請不要讓他還比妳努力";
        System.out.println(HanLP.segment(text)); // 分词
        System.out.println(HanLP.extractKeyword(text, 2)); // 提取关键字,同时指定提取的个数
        System.out.println(HanLP.extractPhrase(text, 2)); // 提取短语,,同时指定提取的个数
        System.out.println(HanLP.extractSummary(text, 2)); // 提取摘要,同时指定提取的个数
        System.out.println(HanLP.getSummary(text,10));  //提取短语,同时指定摘要的最大长度
        System.out.println(HanLP.convertToTraditionalChinese(text)); // 简体字转为繁体字
        System.out.println(HanLP.convertToSimplifiedChinese(traditionText)); // 繁体字转为简体字
        System.out.println(HanLP.convertToPinyinString(text, " ", false)); // 转为拼音

参考:https://www.cnblogs.com/hufulinblog/p/10025933.html

原文地址:https://www.cnblogs.com/51python/p/11087204.html