3 爬取网页的通用代码框架

爬取网页的通用代码框架

 1 """通用代码框架"""
 2 
 3 
 4 import requests
 5 
 6 def getHTMLText(url):
 7     try:
 8         r = requests.get(url, timeout = 30)
 9         r.raise_for_status() # 如果状态码不是200，引发HTTPERROR
10         r.encoding = r.apparent_encoding
11         return r.text
12     except:
13         return "产生异常"
14 
15 
16 if __name__ == "__main__":
17     url = "https://www.baidu.com"
18     print(getHTMLText(url))

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/sruzzg/p/13041583.html

推荐文章
php中include()和require()的区别
样式重置 css reset
微信小程序开发之画布canvas 饼状图
mysql 基础增删改查语句
php正则
PHP正则表达式
常用的Mysql数据库操作语句大全
PHP开发环境的搭建——XAMPP的安装与配置(Windows)
在Sublime Text3中运行PHP代码
Java——IO类，字符流写数据
Java——IO类字符流概述
Java——IO类，字节流缓冲区
Java——IO类，字节流读数据
Java——IO类，字节流写数据
Java——IO类字节流概述
Java——使用File类递归遍历指定路劲下的所有文件
Java——文件过滤器
Java——File类概述
Java——File类成员方法
[Codeforces Round #629 (Div. 3)]
[Codeforces Round #498 (Div. 3)] -F. Xor-Paths （折半搜索）
Best Reward [HDU
[Educational Codeforces Round 72] A. Creating a Character （简单数学）
[Codeforces Round #624 (Div. 3)] -E. Construct the Binary Tree （构造二叉树）
[Codeforces Round #626 (Div. 2, based on Moscow Open Olympiad in Informatics)] -D. Present（异或性质，按位拆分，双指针）
[Codeforces Round #626 (Div. 2, based on Moscow Open Olympiad in Informatics)] -D. Present（异或性质，按位拆分，树桩数组）
[Educational Codeforces Round 83 ] E. Array Shrinking
[AtCoder Beginner Contest 158]
[CodeCraft-20 (Div. 2)]- E. Team Building （状压DP）
HDU 3308 LCIS (线段树区间合并)