2月17日毕设进度

根据河北省创新百强和河北省领军百强从新浪爬取出对应信息

遇到的问题有不能通过伪造浏览器爬取,他的防爬取机制是会爬取过多会页面不断刷新时有时显示有时不显示

原文地址:https://www.cnblogs.com/z12568/p/12498703.html