后端程序员之路 19、结巴分词

有哪些比较好的中文分词方案? - 知乎
https://www.zhihu.com/question/19578687

fxsjy/jieba: 结巴中文分词
https://github.com/fxsjy/jieba

关键功能与特性:
1、中文分词,支持繁体和自定义词典,非win支持并行
2、词性标注
3、关键词提取

jieba(结巴)分词种词性简介 - suibianshen2012的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/suibianshen2012/article/details/53487157

Python的结巴分词处理大文件如何优化可提高速度? - 知乎
https://www.zhihu.com/question/35748720

原文地址:https://www.cnblogs.com/zapline/p/6593520.html