requests基础爬取流程


# 需求：爬取搜狗首页的页面数据
import requests
if __name__ == '__main__':
    # 1指定url
    url = 'https://www.sogou.com/'
    # 2发起请求
    res = requests.get(url=url) # get方法会返回一个响应对象
    # 3 获取响应数据.text返回的是字符串形式的响应数据
    page_text = res.text
    print(page_text)
    # 4 持久化存储
    fp =  open('./sogou.html','w',encoding='utf-8')
    fp.write(page_text)
    print('爬取数据成功')

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/huahuawang/p/12692218.html

推荐文章
wifi免密码登录认证流程
SCWS 中文分词
sphider 丁廷臣简体中文完美汉化版带蜘蛛搜索引擎程序 v1.3.4
如何使用微信JS-SDK实际分享功能
微信JS SDK Demo
搜索引擎根据原Sphider的脚本修正后的 Sphider-plus 2.2
Sphider + SCWS 打造完美PHP中文搜索引擎
MySQL批量SQL插入性能优化
如何改变iframe滚动条的样式？
java中break，continue，标签实现goto效果（编程思想）
装载Properties资源文件的项目中使用
对象存储在什么地方（java编程思想）
2、流
1、lambda表达式
论integer是地址传递还是值传递（转）
jdk1.8的lambda语法（转）
源发行版 1.8 需要目标发行版 1.8（转）
使用java.net.URLConnection发送http请求
得到最长连续递增序列
Git安装遇到的问题fatal: Could not read from remote repository.的解决办法
Mayi_Maven安装与配置Myeclipse、Idea
MY_Selenium登录126邮箱，定位不到账号输入框解决办法
MY_使用selenium自动登录126/163邮箱并发送邮件
2、TestNG+Maven+IDEA环境搭建
1、Maven安装教程详解
git常用命令
LUA_linux的安装
vsftp虚拟用户配置
apache日志切割
NTP Reply Flood Attack （NTP反射型DDos攻击）