Python爬虫之post请求

暑假放假在家没什么事情做,所以在学习了爬虫,在这个博客园里整理记录一些学习的笔记。

构建表单数据(以http://www.iqianyue.com/mypost 这个简单的网页为例)

查看源代码,发现name属性值为“name”,密码对应的输入框中,name属性值为“pass”。因此构建表单的数据中要包含两个字段,字段名为“name”,“pass”,字段值设置成对应的需要传递的值。

格式为字典:

       {字段名1:字段值1,字段名2:字段值2,...}

下面是代码:

# post请求
import urllib.request
import urllib.parse
url="http://www.iqianyue.com/mypost/"
mydata=urllib.parse.urlencode({
    "name":"nihao","pass":"niyehao"
}).encode("utf-8")
req=urllib.request.Request(url,mydata)
data=urllib.request.urlopen(req).read()

fh=open("D:/文件夹暑假学习/3.html","wb")
fh.write(data)
fh.close()

  

思路:

1.设置好url网址

2.构建表单,并且用urllib.parse.urlencod对数据进行编码处理

3.创建Request对象,参数包括URL地址和传递的数据

5.打开对应的Request对象,完成信息传递

6.然后保存为html文件(可不需要)

 由于是初学者,如果大家发现有错,请多多指教。

原文地址:https://www.cnblogs.com/pangzx/p/9499296.html