Python爬虫入门教程 14-100 All IT eBooks多线程爬取

1.All IT eBooks多线程-写在前面

对一个爬虫爱好者来说,或多或少都有这么一点点的收集癖 ~ 发现好的图片,发现好的书籍,发现各种能存放在电脑上的东西,都喜欢把它批量的爬取下来。 然后放着,是的,就这么放着…然后慢慢的遗忘掉…

6af89bc8gw1f8sw1x8sumg205m05k74f.gif

All IT eBooks多线程-爬虫分析

打开网址 http://www.allitebooks.com/ 发现特别清晰的小页面,一看就好爬
在这里插入图片描述

在点击一本图书进入,发现下载的小链接也很明显的展示在了我们面前,小激动一把,这么清晰无广告的网站不多见了。
在这里插入图片描述

All IT eBooks多线程-撸代码

这次我采用了一个新的模块 requests-html 这个模块的作者之前开发了一款 requests

原文地址:https://www.cnblogs.com/hzcya1995/p/13311583.html