大数据分析01——数据爬取

2020.3.22

pycharm:使用python进行爬取,并存储到文件

1.爬取网页的通用代码框架

1 try:
2     r = requests.get(url, timeout = 30)
3     r.raise_for_status()
4     r.encoding = r.apparent_encoding
5     return r.text
6 except:
7     return "产生异常"

养成编写爬虫用try-except的方式来保证网络连接异常能被有效处理的习惯。

2.

原文地址:https://www.cnblogs.com/zhangzhongkun/p/12548862.html