Ubuntu安装使用pyltp和StanfordCoreNLP

环境:Ubuntu 16.04+anaconda3

一、pyltp

1. 安装

直接用pip安装:

pip install pyltp

 然后下载语言模型库,网址:https://pan.baidu.com/share/link?shareid=1988562907&uk=2738088569#list/path=%2F

这里我下载的是最新的3.4.0的版本,路径随意。

2. 使用

import pyltp

安装成功之后,尝试import发现报错:undefined symbol: _ZTISt19__codecvt_utf8_baseIwE

然后各种百度,无果,最后还是在谷歌第一条就搜到了解决方法,附上链接:https://github.com/HIT-SCIR/pyltp/issues/58

解决方法:

cd ~/anaconda2/lib
rm libstdc++.so.6.0.19
ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 libstdc++.so.6.0.19

 然后再尝试import,成功!

二、StanfordCoreNLP

按照以下逐步安装:

1. jdk-8u181-linux-x64.tar.gz(Java环境):参考https://blog.csdn.net/yan3013216087/article/details/78307258

2. stanford-corenlp-full-2018-02-27.zip(Stanford NLP程序包):链接:https://stanfordnlp.github.io/CoreNLP/,点击下方的download corenlp 3.9.1

3. stanford-chinese-corenlp-2018-02-27-models.jar(Stanford中文语言模型):跟上步一样的链接,然后点击下方的Chinese下载:

4. stanford-corenlp-master.zip(用Python实现的API接口,非常方便!):链接https://github.com/Lynten/stanford-corenlp,按照说明里的安装与使用就可以,是查到的最方便的了!也可以直接调用Chinese里的模型。

原文地址:https://www.cnblogs.com/a-present/p/9741376.html