今天突然把博客给申请了,以前也想过的,奈于自己觉得水平还太低有点不好意思写博客,但是后来一想,自己的记录所学,加深印象,主要还是为了学习进步,不怕丢人!今天就稍微回顾一下这两天写的一段用python模拟浏览器登录自己学校官网的代码吧(多亏大神指导了)。
1 import urllib
2 import urllib2
3 import cookielib
4
5 login_url = "xxxxxxxxxxxxx"
6
7 cj = cookielib.CookieJar()#实例化对象,创建cookie容器cj
8 opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))#通过build_opener方法构造一个包含把cookie传给HTTP...构造方法的类实例的URL访问器
9
10 contens = opener.open(login_url).read()#这里是因为学校官网提交的表单中需要有一个lt参数,而它是变化的所以先获取解析一下得到它
11 lt = re.findall('<input type="hidden" name="lt" value="(.*)" />',contents1)
12
#好了现在把需要POST的数据都放到form_info中,里面的参数要具体分析!查看页面HTML的表单!
13 form_info={"username":"xx","password":"xx","lt":lt[0],"_eventId":"submit","errors":"0"}
14
15 postData = urllib.urlencode(form_info)
17 opener.addheaders=[("User-Agent","xxxx"),]#加个浏览器的请求头信息,模拟浏览器访问
18
19 resp = opener.open(login_url,postData)#开始登录
20
21 print resp.read()
22
23 #一般情况下到这里就可以继续用构造好的opener继续访问里面的页面了,可能里面有一些特别的页面会访问不了,具体问题还需具体分析
http://www.cnblogs.com/inva/p/4200189.html