爬虫中需要关注的一些HTTP协议的知识:

'''
爬虫中需要关注的一些HTTP协议的知识:


请求:
url:统一资源定位符
请求方法:
get:请求数据,将数据拼接在url后面.
post:数据放在请求体中.
请求体:
formdata:
json:
file:
请求头:
Cookie:标记登录状态的
User-Agent:记录用户身份
referer:告诉服务器你从哪里来

响应:
Status Code:状态表示码
1XX:请求不成功
2xx:请求成功,
3xx:重定向
4xx:请求错误,例如404请求资源不存在
5xx:服务器错误
这个状态标识码,也不是唯一确定的,这个返回结果可以是开发人员自己
设置自己定义的,并不一定都遵循这个规律.
响应头:
location:重定向的地址
Set-Cookie:设置cookie
特别字段:某些网站特有的
响应体:
1.html源码
2.二进制:图片,视频
3.json

'''
原文地址:https://www.cnblogs.com/1832921tongjieducn/p/11492751.html