Python3 网络爬虫开发实战学习弱点书签

1. urllib.robotparse模块对robot.txt文件的解析,can_fetch()方法和parse()方法。  Page121

2. lxml.etree模块自动补全Html代码,Html()方法和parse()两种方法打开文件。  Page159  

原文地址:https://www.cnblogs.com/strivepy/p/9238146.html