Python爬虫(一)

import urllib2

response = urllib2.urlopen("http://www.baidu.com")
print response.read()

该代码抓取的是百度的源码


其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写

import urllib2

request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()

其结果完全一样

GET与POST数据传送的区别:

get是直接以链接方式访问、链接中包含了所有的参数,当然如果包含了密码的话是一种不安全的选择,不过你可以直观地看到自己提交了什么内容。POST则不会在网址上显示所有的参数,不过如果你想直接查看提交了什么就不太方便了,



有待更新、敬请关注


原文地址:https://www.cnblogs.com/Tovi/p/6194773.html