scrapy基本介绍

scrapy初识

  • 什么是框架?
    • 所谓的框架简单通用解释就是就是一个具有很强通用性并且集成了很多功能的项目模板,该模板可被应用在不同的项目需求中。也可被视为是一个项目的半成品。
  • 如何学习框架?
    • 对于刚接触编程或者初级程序员来讲,对于一个新的框架,只需要掌握该框架的作用及其各个功能的使用和应用即可,对于框架的底层实现和原理,在逐步进阶的过程中在慢慢深入即可。
  • 什么是scrapy?
    • Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍。其内部已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)。对于框架的学习,重点是要学习其框架的特性、各个功能的用法即可。

scrapy基本使用

    • 环境安装:
      • linux和mac操作系统:
        • pip install scrapy
      • windows系统:
        • pip install wheel
        • 下载twisted,下载地址为http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
        • 安装twisted:pip install Twisted‑17.1.0‑cp36‑cp36m‑win_amd64.whl
        • pip install pywin32
        • pip install scrapy
          测试:在终端里录入scrapy指令,没有报错即表示安装成功!
    • scrapy使用流程:
      • 创建工程:
        • scrapy startproject ProName
      • 进入工程目录:
        • cd ProName
      • 创建爬虫文件:
        • scrapy genspider spiderName www.xxx.com
      • 编写相关操作代码
      • 执行工程:
        • scrapy crawl spiderName
原文地址:https://www.cnblogs.com/huahuawang/p/12693278.html