NLP初试牛刀,NLTK入门第一篇

之前下载过一个PDF,书名是《用python进行自然语言处理》,挺有意思的,加上NLP和机器学习目前大热,想趁着暑假涉猎一下。于是开始了入门NLP之旅。

安装环境:Ubuntu14.04桌面版,python版本:2.7

第一步:安装nltk,首先要安装pip工具:sudo apt-get install python-pip,安装完成后用pip安装nltk:sudo pip install python-nltk。

第二步:下载nltk所有的包,在终端中进入python的交互模式,

>>> import nltk
>>> nltk.download()
>>> d
>>> all

接着就等吧,包很大,我断断续续下了两三天才下完。

第三步,安装numpy和matplotlib工具,主要是用来数据分析和图形化显示。下面是引用别人的一部分:

安装numpy相对简单,以下命令可以完成
 
$ sudo apt-get install python-numpy
$ sudo apt-get install python-scipy
 
安装matplotlib相对复杂一些
需要先安装其依赖的包libpng和freetype
安装libpng:
$ sudo apt-get install libpng-dev
 
安装freetype:
 
$ cd ~/Downloads
$ wget http://download.savannah.gnu.org/releases/freetype/freetype-2.4.10.tar.gz
$ tar zxvf freetype-2.4.10.tar.gz
$ cd freetype-2.4.10/
$ ./congfigure
$ make
$ sudo make install
 
安装好pip后就可以用下面的命令来查找matplotlib和查看其安装状态
$ sudo pip search matplotlib
 
安装matplotlib
$ sudo pip install matplotlib
 
完成上述的步骤,就可以正式进入NLTK学习啦!
原文地址:https://www.cnblogs.com/puyangsky/p/4763234.html