python爬虫之Anaconda安装

Anaconda概述

Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。Anaconda利用工具/命令conda来进行package和environment的管理,并且已经包含了Python和相关的配套工具。

这里先解释下conda、anaconda这些概念的差别。conda可以理解为一个工具,也是一个可执行命令,其核心功能是包管理环境管理。包管理与pip的使用类似,环境管理则允许用户方便地安装不同版本的python并可以快速切换。Anaconda则是一个打包的集合,里面预装好了conda、某个版本的python、众多packages、科学计算工具等等,所以也称为Python的一种发行版。其实还有Miniconda,顾名思义,它只包含最基本的内容——python与conda,以及相关的必须依赖项,对于空间要求严格的用户,Miniconda是一种选择。

进入下文之前,说明一下conda的设计理念——conda将几乎所有的工具、第三方包都当做package对待,甚至包括python和conda自身!因此,conda打破了包管理与环境管理的约束,能非常方便地安装各种版本python、各种package并方便地切换。

Anaconda的安装

Anaconda的下载页参见官网下载,Linux、Mac、Windows均支持。

安装时,会发现有两个不同版本的Anaconda,分别对应Python 2.7和Python 3.5,两个版本其实除了这点区别外其他都一样。后面我们会看到,安装哪个版本并不本质,因为通过环境管理,我们可以很方便地切换运行时的Python版本。(由于我常用的Python是2.7和3.4,因此倾向于直接安装Python 2.7对应的Anaconda)

下载后直接按照说明安装即可。这里想提醒一点:尽量按照Anaconda默认的行为安装——不使用root权限,仅为个人安装,安装目录设置在个人主目录下(Windows就无所谓了)。这样的好处是,同一台机器上的不同用户完全可以安装、配置自己的Anaconda,不会互相影响。

Anaconda 的优点?

Anaconda的优点总结起来就八个字:省时省心、分析利器。

  • 省时省心: Anaconda通过管理工具包、开发环境、Python版本,大大简化了你的工作流程。不仅可以方便地安装、更新、卸载工具包,而且安装时能自动安装相应的依赖包,同时还能使用不同的虚拟环境隔离不同要求的项目。

  • 分析利器:Anaconda 官网中是这么宣传自己的:适用于企业级大数据分析的Python工具。其包含了720多个数据科学相关的开源包,在数据可视化、机器学习、深度学习等多方面都有涉及。不仅可以做数据分析,甚至可以用在大数据和人工智能领域。


什么是 conda ?

conda 是开源包(packages)和虚拟环境(environment)的管理系统。

   packages 管理:

     可以使用 conda 来安装、更新 、卸载工具包 ,并且它更关注于数据科学相关的工具包。在安装 anaconda 时就预先集成了像 Numpy、Scipy、 pandas、Scikit-learn 这些在数据分析中常用的包。另外值得一提的是,conda 并不仅仅管理Python的工具包,它也能安装非python的包。比如在新版的 Anaconda 中就可以安装R语言的集成开发环境 Rstudio。

   虚拟环境管理: 在conda中可以建立多个虚拟环境,用于隔离不同项目所需的不同版本的工具包,以防止版本上的冲突。对纠结于 Python 版本的同学们,我们也可以建立 Python2 和 Python3 两个环境,来分别运行不同版本的 Python 代码。


  国外下载(官网):

    下载地址:https://www.anaconda.com/download/

    下载版本:https://repo.continuum.io/archive/Anaconda3-5.0.0.1-Linux-x86_64.sh

  国内下载:

       http://mirrors.ustc.edu.cn/

    下载:https://mirrors.ustc.edu.cn/anaconda/archive/

Linux安装:

#首先给脚本一个可执行权限
chmod 755 Anaconda3-5.0.0.1-Linux-x86_64.sh

#执行脚本,根据提示该回车的回车。
sh Anaconda3-5.0.0.1-Linux-x86_64.sh

#添加环境变量
export PATH=/root/anaconda3/bin:$PATH

#要不你重启执行,要不就执行下面命令让环境变量立刻生效。
source /etc/profile

#查看版本
anaconda -V

#测试安装scrapy
coda install scrapy


[root@localhost ~]# python
Python 3.6.2 |Anaconda, Inc.| (default, Sep 30 2017, 18:42:57)
[GCC 7.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import scrapy
>>>

  

安装完成后,我们还需要对所有工具包进行升级,以避免可能发生的错误。打开你电脑的终端,在命令行中输入:

conda upgrade --all

这里 package_name 是需要安装包的名称。你也可以同时安装多个包,比如同时安装numpy 、scipy 和 pandas,则执行如下命令:

conda install numpy scipy pandas

你也可以指定安装的版本,比如安装 1.1 版本的 numpy :

conda install numpy=1.10

移除一个 package:

conda remove package_name

升级 package 版本:

conda update package_name

  

查看所有的 packages:

conda list

  

如果你记不清 package 的具体名称,也可以进行模糊查询:

conda  search search_term

  

参考与:http://www.jianshu.com/p/169403f7e40c

原文地址:https://www.cnblogs.com/lei0213/p/7727484.html