nltk安装配置以及语料库的安装配置

一 nltk的安装

  nltk的安装个人推荐使用pip安装 直接在pycharm的Termial中安装即可

   其中 安装语句为 pip3 install nltk (如有python版本不同 可尝试pip install nltk)

  此处我的已经安装过所以显示的是安装位置  在安装时如果很慢 可以使用其他的源路径 如

阿里云 :-i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
中国科技大学: https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) :http://pypi.douban.com/simple/
清华大学 :https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学 :http://pypi.mirrors.ustc.edu.cn/simple/

二 安装nltk语料库

 之后在调用相关库函数时会提示你相关的语料库不存在 需要安装

其中提示在python控制台输入

import nltk

nltk.download()

然后会弹出一个nltk downloader nltk下载器

但是由于一些问题 我认为这是端口的原因 他的下载路径一个美国的网址 而ip的进入就会有一些问题

网上相关的解释 会让你设置hosts文件

于是我选择的手动安装 语料库

在使用库函数的时候会在最后提示你可以安装的路径

这些路径都是它可以找到的路径 手动安装好语料库压缩包后 将其解压到任一路径即可

 

在github上下载语料库:https://github.com/nltk/nltk_data

文件有些大 大概600MB

在下载完成后 直接将里面的packages文件名改成nltk_data(里面的压缩包都要解压),然后放在该放的路径下。

然后再次运行代码 成功运行

原文地址:https://www.cnblogs.com/huangmouren233/p/14735341.html