Python+Scrapy

准备做一个爬虫,看了一下Python比较合适,花了一天时间学了一下语法,又找了一下有专门的爬虫框架Scrapy。以下是学习过程。

1. 安装Scrapy

  中文说明:http://scrapy-chs.readthedocs.org/zh_CN/latest/intro/install.html

    Required:

        (1) Python2.7。

        (2) lxml.

       这个中直接有各种版本的lxml,包括windows中的exe格式的。https://pypi.python.org/simple/lxml/

       安装完后在Python IDLE 中通过"import lxml"试试,如果没有报错,那就是安装好了!

   (3) OpenSSL

       参看平台安装指南。其中需要将C:python27Scripts  C:python27 添加到系统路径中。而我的Python文件夹中没有Script文件夹,看了一下发现是easy_install相关的内容。直接安装setuptools即可自动生成Script文件夹。

      Tips:注意路径跟自己安装的路径相同,不一定跟此处列出来的一致。

    其他python的包按照平台安装指南就可以了。  

  直接通过在cmd中输入“easy_install Scrapy” 就自动安装Scrapy了。

在运行的过程中发现,还需要安装service_identity。具体参见:http://blog.csdn.net/niying/article/details/27103081

原文地址:https://www.cnblogs.com/bore3601/p/3788339.html