solr7中文分词包

刚刚将solr4升级到了solr7.7,发现之前用的mmseg4j中文分词包用的时候会报错,插入新数据是创建索引会有异常

possible analysis error: startOffset must be non-negative, and endOffset must be >= startOffset, and offsets must not go backwards startOffset=2,endOffset=8,lastStartOffset=10 for field 'msg'

应该是mmseg4j跟7.7版本的solr不兼容了,尝试了一下新版本发现mmseg4j已经很久不更新了,尝试了几次还是不行,转向找找其他的分词包,后来发现了ik,主要就一个jar包ik-analyzer,使用方法跟之前的也一样,导入jar包、修改managed-schema、有zookeeper的话可能还需要上传到zk中,并且这个分词包也能方便的支持扩展词典,还是很方便的,具体直接参考原地址https://github.com/magese/ik-analyzer-solr

登录zookeeper控制台

/opt/zookeeper-3.4.14/bin/zkCli.sh -server 10.110.30.32:2181

将solr的配置文件上传到zookeeper

sh /opt/solr/server/scripts/cloud-scripts/zkcli.sh -zkhost 10.110.30.32:2181 -cmd upconfig -confdir /opt/solr/server/solr/configsets/_default/conf/ -confname _default

原文地址:https://www.cnblogs.com/yanh0606/p/11121636.html