python+selenium 之如何跳过登录验证

忙了一段时间没来学习了,今天学习下如何跳过登录验证码登录

首先我们很多系统的登录机制都会有短信验证或者图形验证等,每次自动化代码走到登录的时候,因为随机的验证码,导致无从下手

其实据我所知是有很多种方法可以做到识别验证码或者抓取验证码插入的,不过今天我们先一起学习下如何通过cookie绕过验证码登录系统

用百度的登录做个例子:

from selenium import webdriver

driver = webdriver.Chrome()

driver.get("https://www.baidu.com/")

driver.find_element_by_link_text("登录").click()

t = driver.switch_to_alert()

#切换到alert弹窗

driver.find_element_by_css_selector("[class='tang-pass-footerBarULogin pass-link']").click()

这个时候就到了输入用户名和密码的窗口了,接着写入用户名 和密码点击登录的代码:

driver.find_element_by_css_selector("[class='pass-text-input pass-text-input-userName']").send_keys("XXX")

driver.find_element_by_css_selector("[class='pass-text-input pass-text-input-password']").send_keys("XXX")

driver.find_element_by_css_selector("#TANGRAM__PSP_10__submit").click()

这个时候你就发现,弹出的手机验证码的页面,即使发送了验证码,系统也无法接收到手机验证码,所以一般的流程下是无法使用自动化代码登录成功的

这里带入一些driver.cookie的方法,

1.get_cookies():获取所有 cookies

2.driver.get_cookie(name):获取指定 name 的 cookie:

3.清除指定 cookie:delete_cookie()

4.delete_all_cookies():清除所有 cookies

5.add_cookie(cookie_dict):添加 cookie

我们要用的就是第五个,添加登录后的cookie值来绕过登录验证码

首先通过get_cookies()获取所有 cookies 格式如下:

[{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '1431_21104_18559_28131_28267'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'delPer', 'path': '/', 'secure': False, 'value': '0'}, {'domain': '.baidu.com', 'expiry': 3695019135.360794, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': 'B972D8DB7A1AA0C96556FD1E705B8071:FG=1'}, {'domain': '.baidu.com', 'expiry': 3695019135.36084, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1547535489'}, {'domain': '.baidu.com', 'expiry': 3695019135.360821, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': 'B972D8DB7A1AA0C96556FD1E705B8071'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '0'}, {'domain': 'www.baidu.com', 'expiry': 1548399488, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314353'}]

再使用抓包工具fiddler 抓取登录后的cookie,登录前和登录后的对比 登录后会多出的cookie数据:

BDUSS=10cjB0UWdKWGt5UUhBcWxrR3MzV3ZFWW12Zk5KNkkyRjFPdHI3cGxyeWpFV1ZjQVFBQUFBJCQAAAAAAAAAAAEAAADTqzeQuu.....

对应的name值为‘’BDUSS‘’

对应的value值为‘’10cjB0UWdKWGt5UUhBcWxrR3MzV3ZFWW12Zk5KNkkyRjFPdHI3cGxyeWpFV1ZjQVFBQUFBJCQAAAAAAAAAAAEAAADTqzeQuu.....‘’

我们截取cookie格式的第一个括号内容:

{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '1431_21104_18559_28131_28267'}

然后执行cookie内容的替换和添加:

完整代码如下

from selenium import webdriver

driver = webdriver.Chrome()

driver.get("https://www.baidu.com/")

cookie = {u'domain': u'.baidu.com',
      u'httpOnly': False,
      u'name': u'BDUSS',
      u'path': u'/',
      u'secure': False,
      u'value': u'JXTlVLYjhtWEJvOG55VUlBM3NpbGFYT0lSVXVDQk1SN1NkWlFPWHJjalpEbVZjQVFBQUFBJCQAAAAAAAAAAAEAAADTqzeQuu.....}

driver.add_cookie(cookie)
#添加登录后的cookie跳过登录验证


driver.refresh()

#刷新页面

这样我们就可以不用烦验证码的随机性了,直接就可以登录系统了

注:

1.fiddle的抓包工具不会使用的话可以再百度上找,挺简单的,也挺使用的工具

2.登录时候要勾选下次自动登录按钮

3.add_cookie()只添加 name 和 value,对于博客园的登录是不成功。

4.本方法并不适合所有的网站,一般像百度这种记住登录状态的才会适

原文地址:https://www.cnblogs.com/huahuage/p/10272053.html