selenium模块的基本使用

selenium模块的基本使用

问题:selenium模块和爬虫之间的关联
- 便捷的获取网站中动态加载的数据
- 便捷实现模拟登录
什么是selenium模块:基于浏览器自动化的模块
- 环境安装

下载安装selenium:pip install selenium

下载浏览器驱动程序:
    http://chromedriver.storage.googleapis.com/index.html

查看驱动和浏览器版本的映射关系:
    http://blog.csdn.net/huilan_same/article/details/51896672

实例化一个浏览器对象:
编写基于浏览器自动化的操作代码
    - 发起请求:get(url)
    - 标签定位:find系列的方法
    - 标签交互:send_keys('xxx')
    - 执行js程序:excute_script('jsCode')
    - 前进、后退:back(),forward()
    - 关闭浏览器:quit()
selenium处理iframe
     - 如果定位的标签存在于iframe标签之中,则必须使用switch_to.frame(id)
     - 动作链拖动:from selenium.webdriver import ActionChains
        - 实例化一个动作链对象:action = ActionChains(bro)
        - click_and_hold(div):长安且点击操作
        - move_by_offset(x,y)
        - perform()让动作链立即执行
        - action.release()释放动作链对象

12306模拟登录
- 超级鹰:http://www.chaojiying.com/
- 12306模拟登录编码流程
- 使用selenium打开登陆页面
- 对当前selenium打开的这张页面进行截图
- 对当前局部区域(验证码图片)进行裁剪
- 好处:将验证码图片和模拟登录进行一一对应
- 使用超级鹰识别验证码图片(坐标)

原文地址:https://www.cnblogs.com/gerenboke/p/13389255.html