web自动化:selenium原理和元素定位(一)

一. Selenium2 WebDriver

  • 当Selenium2.x提出了WebDriver的概念后,它提供了完全另外的一种方式与浏览器交互
  • 那就是利用浏览器原生的API,封装成一套更加面向对象的Selenium WebDriver API,直接操作浏览器页面里的元素,甚至操作浏览器本身(截屏、窗口大小、启动、关闭、安装插件、配置证书之类的)

  • 由于使用的是浏览器原生的API,速度大大提高,而且调用的稳定性交给了浏览器厂商本身,显然是更加科学

  • 然而带来的一些副作用就是,不同的浏览器厂商,对web元素的操作和呈现多少会有一些差异,这就直接导致了Selenium WebDriver要分浏览器厂商不同,而提供不同的实现

  • 例如Firefox就有专门的FirefoxDriver,Chrome就有专门的ChromeDriver等等(甚至包括了AndroidDriver和IOS WebDriver)

二. Selenium环境搭建以及原理解释

简而言之,就是selenium里面的webdriver会直接控制浏览器(通过不同浏览器的驱动),然后对目标进行测试—>UI层面的

三. 常用方法

1. 创建对象driver

driver = webdriver.Chrome()

2. 浏览器中加载url

driver.get(url)

3. 浏览器窗口最大化

driver.maximize_window()

4. 浏览器窗口固定大小

driver.set_window_size(x, y)

5. 向前

driver.forward()

6. 后退

driver.back()

7. 刷新

driver.refresh()

8. 截屏

driver.get_screenshot_as_file(filename)

9. 设置等待时间:时间单位为s,有时候页面元素加载不全的时候,我们需要去用等待时间,等待页面加载完全

import time

time.sleep(n)

10. 获得当前页面的url

driver.current_url

11. 获得当前页面的标题

driver.title

12. 退出

driver.quit()   用于结束进程,关闭所有的窗口,最后测试结束的时候,建议大家用quit
close()         用于关闭当前窗口,当打开的窗口较多时,就可以用close关闭部分窗口

四. 常用定位

find_element_by_XXX  只返回符合定位表达式的html页面中的第一个元素

find_elements_by_XXX  返回的是一个列表

以百度首页为例

1. id定位(优先使用id,但如果id是动态生成的,就不能使用了)

id中带数字的就要注意一下,看是不是动态的

driver.find_element_by_id("kw)

2. class定位

driver.find_element_by_class_name("s_ipt)
driver.find_elements_by_class_name("s_ipt)

3. name定位

driver.find_element_by_name("wd)
driver.find_elements_by_name("wd)

4. tag name定位

driver.find_element_by_tag_name("input)
driver.find_elements_by_tag_name("input)

5. link text定位

driver.find_element_by_link_text("贴吧")           #利用全部link文本定位

6. partial link text定位

driver.find_element_by_partial_link_text("贴")   #利用部分link文本定位

7. xpath定位

driver.find_element_by_xpath()
driver.find_elements_by_xpath()

8. CSS定位

CSS中,  #id值   .class值   写法是标签名[属性名=值]

CSS中用空格表示层级关系, 如 span input中sapn是input的父级

实例1:通过id来定位输入框,前面的*表示标签名

实例2:通过属性name来定位输入框,前面的*表示标签名  

实例3:通过class定位输入框

实例4:层级定位,用空格分割

五. xpath定位

1. 绝对路径定位:以 "/"  开头,从文档的根节点开始解析。可使用浏览器调试工具,来直接获得xpath语句

2. 绝对路径的缺点

当页面结构有调整的时候,路径也随之失效,必须重写,不方便后期维护

3. 相对路径定位:以"//"开头,从文档的任何元素节点开始解析

其他语法:

表达式 描述
nodename 选取此节点的所有子节点
. 选取当前节点
.. 选取当前节点的父节点
@ 选取属性, 举例://div[@属性名称="属性值"]
* 通配符,匹配所有

 

 

 

 

 

实例1:定位百度输入框,根据属性name="wd"   (可在谷歌浏览器调试工具中按Ctrl + F打开定位输入框)

实例2:如果//标签[@属性]仍然有多个元素,可考虑层级定位,举个例子,如果input有多个时,可考虑层级定位(找父级或父级以上)

4. xpath定位和函数和逻辑

函数和逻辑 描述 举例
text() 元素的text内容 //*[@id="xxx"]//p[text()="xxxx"]
contains(@属性/text(), value) 包含函数 contains(@class, "xxx"), contains(text(), "xxxx")

and

or

表示条件与

表示条件或

//div[@class="xxx" and contains(@style, "display:visibility")]

实例1:利用xpath text()函数定位

实例2:利用xpath contains()函数定位

实例3:利用xpath 逻辑与定位

5. 弹出框问题

一个页面的几个操作,都会有弹出框出现,定位到弹出框会有几个,但通过display的值来定位到当前显示的那一个

  • "display=none"表示无弹出框

  • "display=block/visibility"表示有弹出框

实例1:百度有弹出框的页面

实例2:百度无弹出框的页面

原文地址:https://www.cnblogs.com/my_captain/p/9162887.html