爬虫学习

#通用爬虫框架
import requests as r
def getHTMLText(url):
    try:
        t=r.get(url,timeout=30)     #请求网页得到对象
        t.raise_for_status()        #如果状态不是200，引发HTTPError
        t.encoding=t.apparent_encoding  #使得返回解码是正确的
        return t.text
    except:
        return "产生异常"
if __name__ == "__main__":
    url = "http://www.baidu.com"
    print(getHTMLText(url))

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/xinqidian/p/10200805.html

推荐文章
欧拉函数的一些性质
GCD
F
W
Bi-shoe and Phi-shoe LightOJ
A
D. Ehab the Xorcist
直方图最大矩形【单调栈】
编辑器题目【栈。对顶堆】
手搓kmp朴素版{代码}
秦腾与教学评估【前缀和+二分】
c++中成员函数声明时const得作用
简练软考知识点整理-制定项目章程过程
简练软考知识点整理-项目收尾过程组
简练软考知识点整理-项目监控过程组
简练软考知识点整理-项目执行过程组
简练软考知识点整理-项目规划过程组
简练软考知识点整理-项目启动过程组
简练软考知识点整理-项目管理过程与过程组
简练软考知识点整理-项目干系人管理简介
简练软考知识点整理-项目采购管理简介
简练软考知识点整理-项目风险管理简介
SQL(replace)替换字段中指定的字符
sh 脚本名字和./脚本名字有什么区别
linux下tar命令解压到指定的目录
查看文件MD5值
Topo check failed. Mapred tasks exceed 1000000000
cron表达式详解
Linux下#!/usr/bin/env bash和#!/usr/bin/bash、#!/bin/bash的比较
linux中seq命令用法