图书爬虫的进展

豆瓣的数据抓取中,豆瓣的反扒措施比较严谨,这里不得已采用了芝麻代理的ip,豆瓣的数据整理的比较好。

另外也对比过京东和当当的数据,发现当当的图书数据是最乱的。

原文地址:https://www.cnblogs.com/mazhiyong/p/11798708.html