一篇文章搞定Python Selenium库的使用（超级详细！！再也不怕自动化测试）

可以从PyPI的官方库中下载该selenium支持库，点此下载当然，更好的方法当然是使用 pip 命令来安装selenium包。 Python3.5的 [](#id4)标准库 <https://docs.python.org/3.5/installing/index.html>_中包含pip命令。使用 [](#id6)pip命令,你可以像下面这样安装 selenium:

pip install selenium

Note

使用Python2.x版本的用户可以手动安装pip或者easy_install，下面是easy_install 的安装方法:

easy_install selenium

你可以考虑使用virtualenv <http://www.virtualenv.org>_ 创建独立的Python环境。Python3.5中pyvenv <https://docs.python.org/3.5/using/scripts.html#scripts-pyvenv>_ 可以提供几乎一样的功能。

Windows用户的详细说明

Note

请在有网的情况下执行该安装命令。

安装Python3.5：官方下载页.
从开始菜单点击运行（或者Windows+R）输入cmd,然后执行下列命令安装:
```
C:Python35Scriptspip.exe install selenium
```

现在你可以使用Python运行测试脚本了。例如：如果你创建了一个selenium的基本示例并且保存在了C:my_selenium_script.py，你可以如下执行:

C:Python35python.exe C:my_selenium_script.py

下载 Selenium 服务器

如果你想使用一个远程的WebDriver，Selenium服务是唯一的依赖，参见使用远程 Selenium WebDriver 获得更多细节。如果你只是刚刚开始学习使用Selenium，你可以忽略该章节直接开始下一节。

Selenium server是一个JAVA工程，Java Runtime Environment (JRE) 1.6或者更高的版本是推荐的运行环境。

你可以在该下载页下载2.x的Selenium server，这个文件大概长成这个样子：selenium-server-standalone-2.x.x.jar，你可以去下载最新版本的2.x server。

如果你还没有安装Java Runtime Environment (JRE)的话，呢，在这下载，如果你是有的是GNU/Linux系统，并且巧了，你还有root权限，你还可以使用操作系统指令去安装JRE。

如果你把java命令放在了PATH(环境变量)中的话，使用下面命令安装:

java -jar selenium-server-standalone-2.x.x.jar

当然了，把2.x.x换成你下载的实际版本就可以了。

如果是不是root用户你或者没有把JAVA放到PATH中，你可以使用绝对路径或者相对路径的方式来使用命令，这个命令大概长这样子:

/path/to/java -jar /path/to/selenium-server-standalone-2.x.x.jar

快速入门

简单用例

如果你已经安装好了selenium，你可以把下面的python代码拷贝到你的编辑器中

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Firefox()
driver.get("http://www.python.org")
assert "Python" in driver.title
elem = driver.find_element_by_name("q")
elem.clear()
elem.send_keys("pycon")
elem.send_keys(Keys.RETURN)
assert "No results found." not in driver.page_source
driver.close()

上面的脚本可以保存到一个文件（如：- python_org_search.py），那么可以这样使用

python python_org_search.py

你运行的 python 环境中应该已经安装了 selenium 模块。

示例详解

selenium.webdriver 模块提供了所有WebDriver的实现，当前支持的WebDriver有： Firefox, Chrome, IE and Remote。 [](#id4)Keys类提供键盘按键的支持，比如：RETURN, F1, ALT等

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

接下来，创建一个Firefox WebDriver的实例

driver = webdriver.Firefox()

driver.get 方法将打开URL中填写的地址，WebDriver 将等待，直到页面完全加载完毕（其实是等到”onload” 方法执行完毕），然后返回继续执行你的脚本。值得注意的是，如果你的页面使用了大量的Ajax加载， WebDriver可能不知道什么时候页面已经完全加载:

driver.get("http://www.python.org")

下一行是用assert的方式确认标题是否包含“Python”一词。 (译注：assert 语句将会在之后的语句返回false后抛出异常，详细内容可以自行百度)

assert "Python" in driver.title

WebDriver 提供了大量的方法让你去查询页面中的元素，这些方法形如： find_element_by_*。例如：包含 name 属性的input输入框可以通过 find_element_by_name 方法查找到，详细的查找方法可以在第四节元素查找中查看:

elem = driver.find_element_by_name("q")

接下来，我们发送了一个关键字，这个方法的作用类似于你用键盘输入关键字。特殊的按键可以使用Keys类来输入，该类继承自 selenium.webdriver.common.keys，为了安全起见，我们先清除input输入框中的任何预填充的文本（例如：”Search”）,从而避免我们的搜索结果受影响：

elem.clear()
elem.send_keys("pycon")
elem.send_keys(Keys.RETURN)

提交页面后,你会得到所有的结果。为了确保某些特定的结果被找到，使用assert如下:

assert "No results found." not in driver.page_source

最后，关闭浏览器窗口，你还可以使用quit方法代替close方法， quit将关闭整个浏览器，而_close——只会关闭一个标签页，如果你只打开了一个标签页，大多数浏览器的默认行为是关闭浏览器:

driver.close()

用Selenium写测试用例

Selenium 通常被用来写一些测试用例. selenium 包本身不提供测试工具或者框架. 你可以使用Python自带的模块unittest写测试用例。 The other options for a tool/framework are py.test and nose.

在本章中，我们使用 unittest 来编写测试代码，下面是一个已经写好的用例。这是一个在 python.org 站点上搜索的案例:

import unittest
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

class PythonOrgSearch(unittest.TestCase):

    def setUp(self):
        self.driver = webdriver.Firefox()

    def test_search_in_python_org(self):
        driver = self.driver
        driver.get("http://www.python.org")
        self.assertIn("Python", driver.title)
        elem = driver.find_element_by_name("q")
        elem.send_keys("pycon")
        elem.send_keys(Keys.RETURN)
        assert "No results found." not in driver.page_source


    def tearDown(self):
        self.driver.close()

if __name__ == "__main__":
    unittest.main()

你可以在shell中运行下列代码:

python test_python_org_search.py
.
----------------------------------------------------------------------
Ran 1 test in 15.566s

OK

结果表明这个测试用例已经成功运行。

逐步解释测试代码

一开始，我们引入了需要的模块， unittest 模块是基于JAVA JUnit的Python内置的模块。该模块提供了一个框架去组织测试用例。 selenium.webdriver 模块提供了所有WebDriver的实现。现在支持的WebDriver有：Firefox, Chrome, IE and Remote. Keys 类提供所有的键盘按键操作，比如像这样的：

RETURN, F1, ALT等。

import unittest
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

该测试类继承自 unittest.TestCase. 继承 TestCase 类是告诉 unittest 模块该类是一个测试用例:

class PythonOrgSearch(unittest.TestCase):

setUp 方法是初始化的一部分, 该方法会在该测试类中的每一个测试方法被执行前都执行一遍。下面创建了一个Firefox WebDriver的一个实例。

def setUp(self):
    self.driver = webdriver.Firefox()

这是一个测试用例实际的测试方法. 测试方法始终以 test开头。在该方法中的第一行创建了一个在setUp 方法中创建的驱动程序对象的本地引用。

def test_search_in_python_org(self):
    driver = self.driver

driver.get 方法将会根据方法中给出的URL地址打开该网站。 WebDriver 会等待整个页面加载完成（其实是等待”onload”事件执行完毕）之后把控制权交给测试程序。如果你的页面使用大量的AJAX技术来加载页面，WebDriver可能不知道什么时候页面已经加载完成:

driver.get("http://www.python.org")

下面一行使用assert断言的方法判断在页面标题中是否包含 “Python”

self.assertIn("Python", driver.title)

WebDriver 提供很多方法去查找页面值的元素，这些方法都以 find_element_by_* 开头。例如：包含 name 属性的input元素可以使用

find_element_by_name方法查找到。详细的细节可以参照 :ref:locating-elements 章节:
elem = driver.find_element_by_name("q")

接下来我们发送keys，这个和使用键盘输入keys类似。特殊的按键可以通过引入selenium.webdriver.common.keys的 Keys 类来输入

elem.send_keys("pycon")
elem.send_keys(Keys.RETURN)

提交页面之后，无论如何你都会得到搜索结果，为了确保某些结果类检索到，可以使用下列断言 After submission of the page, you should get result as per search if

assert "No results found." not in driver.page_source

tearDown 方法会在每一个测试方法执行之后被执行。该方法可以用来做一些清扫工作，比如关闭浏览器。当然你也可以调用 quit 方法代替close方法，

quit 将关闭整个浏览器，而close只会关闭一个标签页，如果你只打开了一个标签页，大多数浏览器的默认行为是关闭浏览器。

def tearDown(self):
    self.driver.close()

下面是入口函数:

if __name__ == "__main__":
    unittest.main()

使用远程 Selenium WebDriver

为了使用远程 WebDriver, 你应该拥有一个正在运行的 Selenium 服务器。通过下列命令运行服务器:

java -jar selenium-server-standalone-2.x.x.jar

Selenium 服务运行后, 你会看到这样的提示信息:

15:43:07.541 INFO - RemoteWebDriver instances should connect to: http://127.0.0.1:4444/wd/hub

上面一行告诉你，你可以通过这个URL连接到远程WebDriver，下面是一些例子:

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

driver = webdriver.Remote(
   command_executor='http://127.0.0.1:4444/wd/hub',
   desired_capabilities=DesiredCapabilities.CHROME)

driver = webdriver.Remote(
   command_executor='http://127.0.0.1:4444/wd/hub',
   desired_capabilities=DesiredCapabilities.OPERA)

driver = webdriver.Remote(
   command_executor='http://127.0.0.1:4444/wd/hub',
   desired_capabilities=DesiredCapabilities.HTMLUNITWITHJS)

[](#id7)desired_capabilities是一个字典，如果你不想使用默认的字典，你可以明确指定的值

driver = webdriver.Remote(
   command_executor='http://127.0.0.1:4444/wd/hub',
   desired_capabilities={'browserName': 'htmlunit',
                         'version': '2',
                        'javascriptEnabled': True})

打开一个页面

你想做的第一件事也许是使用WebDriver打开一个链接。常规的方法是调用 get 方法:

driver.get("http://www.google.com")

WebDriver 将等待，直到页面完全加载完毕（其实是等到 onload 方法执行完毕），然后返回继续执行你的脚本。值得注意的是，如果你的页面使用了大量的Ajax加载， WebDriver可能不知道什么时候页面已经完全加载。如果你想确保也main完全加载完毕，可以使用:ref:waits

与页面交互

只是打开页面其实并没有什么卵用。我们真正想要的是与页面做交互。更具体地说，对于一个页面中的HTML元素，首先我们要找到他。WebDriver 提供了大量的方法帮助你去查找元素，例如：已知一个元素定义如下:

<input type="text" name="passwd" id="passwd-id" />

你可以通过下面的方法查找他:

element = driver.find_element_by_id("passwd-id")
element = driver.find_element_by_name("passwd")
element = driver.find_element_by_xpath("//input[@id='passwd-id']")

你还可以通过链接的文本查找他，需要注意的是，这个文本必须完全匹地配。当你使用XPATH时，你必须注意，如果匹配超过一个元素，只返回第一个元素。如果上面也没找到，将会抛出 [](#id3)NoSuchElementException异常。

WebDriver有一个”基于对象”的API; 我们使用相同的接口表示所有类型的元素。这就意味着，当你打开你的IDE的自动补全的时候，你会有很多可以调用的方法。但是并不是所有的方法都是有意义或是有效的。不过不要担心！当你调用一些毫无意义的方法时，WebDriver会尝试去做一些正确的事情（例如你对一个”meta” 元素调用”setSelected()”方法的时候）。

所以，当你拿到ige元素时，你能做什么呢？首先，你可能会想在文本框中输入一些内容:

element.send_keys("some text")

你还可以通过”Keys”类来模式输入方向键:

element.send_keys(" and some", Keys.ARROW_DOWN)

对于任何元素，他可能都叫 send_keys ，这就使得它可以测试键盘快捷键，比如当你使用Gmail的时候。但是有一个副作用是当你输入一些文本时，这些输入框中原有的文本不会被自动清除掉，相反，你的输入会继续添加到已存在文本之后。你可以很方便的使用 clear 方法去清除input或者textarea元素中的内容:

element.clear()

填写表格

我们已经知道如何在input或textarea元素中输入内容，但是其他元素怎么办？你可以“切换”下拉框的状态，你可以使用setSelected方法去做一些事情，比如选择下拉列表，处理SELECT元素其实没有那么麻烦:

element = driver.find_element_by_xpath("//select[@name='name']")
all_options = element.find_elements_by_tag_name("option")
for option in all_options:
    print("Value is: %s" % option.get_attribute("value"))
    option.click()

上面这段代码将会寻找页面第一个 “SELECT” 元素, 并且循环他的每一个OPTION元素，打印从utamen的值，然后按顺序都选中一遍。

正如你说看到的那样，这不是处理 SELECT 元素最好的方法。WebDriver的支持类包括一个叫做 [](#id6)Select的类，他提供有用的方法处理这些内容:

from selenium.webdriver.support.ui import Select
select = Select(driver.find_element_by_name('name'))
select.select_by_index(index)
select.select_by_visible_text("text")
select.select_by_value(value)

WebDriver 也提供一些有用的方法来取消选择已经选择的元素:

select = Select(driver.find_element_by_id('id'))
select.deselect_all()

这将取消选择所以的OPTION。

假设在一个案例中，我们需要列出所有已经选择的选项，Select类提供了方便的方法来实现这一点:

select = Select(driver.find_element_by_xpath("xpath"))
all_selected_options = select.all_selected_options

获得所以选项:

options = select.options

一旦你填写完整个表单，你应该想去提交它，有一个方法就是去找到一个“submit” 按钮然后点击它:

# Assume the button has the ID "submit" :)
driver.find_element_by_id("submit").click()

或者，WebDriver对每一个元素都有一个叫做 “submit” 的方法，如果你在一个表单内的元素上使用该方法，WebDriver会在DOM树上就近找到最近的表单，返回提交它。如果调用的元素不再表单内，将会抛出NoSuchElementException异常:

element.submit()

拖放

您可以使用拖放，无论是移动一个元素，或放到另一个元素内:

element = driver.find_element_by_name("source")
target = driver.find_element_by_name("target")

from selenium.webdriver import ActionChains
action_chains = ActionChains(driver)
action_chains.drag_and_drop(element, target).perform()

在不同的窗口和框架之间移动

对于现在的web应用来说，没有任何frames或者只包含一个window窗口是比较罕见的。 WebDriver 支持在不同的窗口之间移动，只需要调用switch_to_window方法即可:

driver.switch_to_window("windowName")

所有的 driver 将会指向当前窗口，但是你怎么知道当前窗口的名字呢，查看打开他的javascript或者连接代码:

<a href="somewhere.html" target="windowName">Click here to open a new window</a>

或者，你可以在”switch_to_window()”中使用”窗口句柄”来打开它，知道了这些，你就可以迭代所有已经打开的窗口了:

for handle in driver.window_handles:
    driver.switch_to_window(handle)

你还可以在不同的frame中切换 (or into iframes):

driver.switch_to_frame("frameName")

通过“.”操作符你还可以获得子frame，并通过下标指定任意frame，就像这样:

pythondriver.switch_to_frame("frameName.0.child")

如何获取名叫“frameName”的frame中名叫 “child”的子frame呢？ 来自*top*frame的所有的frame都会被评估 （All frames are evaluated as if from *top*.）

一旦我们完成了frame中的工作，我们可以这样返回父frame:

driver.switch_to_default_content()

弹出对话框

Selenium WebDriver 内置了对处理弹出对话框的支持。在你的某些动作之后可能会触发弹出对话框，你可以像下面这样访问对话框:

alert = driver.switch_to_alert()

它将返回当前打开的对话框对象。使用此对象，您现在可以接受、排除、读取其内容，甚至可以在prompt对话框中输入(译注：prompt()是对话框的一种，不同于alert()对话框，不同点可以自行百度)。这个接口对alert, confirm， prompt 对话框效果相同。参考相关的API文档获取更多信息。

访问浏览器历史记录

在之前的文章中，我们使用get命令打开一个页面, ( driver.get("http://www.example.com"))，WebDriver有很多更小的，以任务为导向的接口， navigation就是一个有用的任务，打开一个页面你可以使用get:

driver.get("http://www.example.com")

在浏览历史中前进和后退你可以使用:

driver.forward()
driver.back()

请注意，这个功能完全取决于底层驱动程序。当你调用这些方法的时候，很有可能会发生意想不到的事情，如果你习惯了浏览器的这些行为于其他的不同。（原文：It’s just possible that something unexpected may happen when you call these methods if you’re used to the behaviour of one browser over another.）

操作Cookies

在我们结束这一节之前，或许你对如何操作Cookies可能会很感兴趣。首先，你需要打开一个也面，因为Cookie是在某个域名下才生效的:

# 打开一个页面 driver.get(“http://www.example.com”)

# 现在设置Cookies，这个cookie在域名根目录下（”/”）生效 cookie = {‘name’ : ‘foo’, ‘value’ : ‘bar’} driver.add_cookie(cookie)

# 现在获取所有当前URL下可获得的Cookies driver.get_cookies()

查找元素

在一个页面中有很多不同的策略可以定位一个元素。在你的项目中，你可以选择最合适的方法去查找元素。Selenium提供了下列的方法给你:

find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector

一次查找多个元素 (这些方法会返回一个list列表):

find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector

除了上述的公共方法，下面还有两个私有方法，在你查找也页面元素的时候也许有用。他们是 find_element 和 find_elements 。

用法示例:

from selenium.webdriver.common.by import By

driver.find_element(By.XPATH, '//button[text()="Some text"]')
driver.find_elements(By.XPATH, '//button')

下面是 By 类的一些可用属性:

ID = "id"
XPATH = "xpath"
LINK_TEXT = "link text"
PARTIAL_LINK_TEXT = "partial link text"
NAME = "name"
TAG_NAME = "tag name"
CLASS_NAME = "class name"
CSS_SELECTOR = "css selector"

通过ID查找元素

当你知道一个元素的 id 时，你可以使用本方法。在该策略下，页面中第一个该 id 元素会被匹配并返回。如果找不到任何元素，会抛出 NoSuchElementException 异常。

作为示例，页面元素如下所示:

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
  </form>
 </body>
<html>

可以这样查找表单(form)元素:

login_form = driver.find_element_by_id('loginForm')

通过Name查找元素

当你知道一个元素的 name 时，你可以使用本方法。在该策略下，页面中第一个该 name 元素会被匹配并返回。如果找不到任何元素，会抛出 NoSuchElementException 异常。

作为示例，页面元素如下所示:

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
   <input name="continue" type="button" value="Clear" />
  </form>
</body>
<html>

name属性为 username & password 的元素可以像下面这样查找:

username = driver.find_element_by_name('username')
password = driver.find_element_by_name('password')

这会得到 “Login” 按钮，因为他在 “Clear” 按钮之前:

continue = driver.find_element_by_name('continue')

通过XPath查找元素

XPath是XML文档中查找结点的语法。因为HTML文档也可以被转换成XML(XHTML)文档， Selenium的用户可以利用这种强大的语言在web应用中查找元素。 XPath扩展了（当然也支持）这种通过id或name属性获取元素的简单方式，同时也开辟了各种新的可能性，例如获取页面上的第三个复选框。

使用XPath的主要原因之一就是当你想获取一个既没有id属性也没有name属性的元素时，你可以通过XPath使用元素的绝对位置来获取他（这是不推荐的），或相对于有一个id或name属性的元素（理论上的父元素）的来获取你想要的元素。XPath定位器也可以通过非id和name属性查找元素。

绝对的XPath是所有元素都从根元素的位置（HTML）开始定位，只要应用中有轻微的调整，会就导致你的定位失败。但是通过就近的包含id或者name属性的元素出发定位你的元素，这样相对关系就很靠谱，因为这种位置关系很少改变，所以可以使你的测试更加强大。

作为示例，页面元素如下所示:

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
   <input name="continue" type="button" value="Clear" />
  </form>
</body>
<html>

可以这样查找表单(form)元素:

login_form = driver.find_element_by_xpath("/html/body/form[1]")
login_form = driver.find_element_by_xpath("//form[1]")
login_form = driver.find_element_by_xpath("//form[@id='loginForm']")

绝对定位 (页面结构轻微调整就会被破坏)
HTML页面中的第一个form元素
包含 id 属性并且其值为 loginForm 的form元素

username元素可以如下获取:

username = driver.find_element_by_xpath("//form[input/@name='username']")
username = driver.find_element_by_xpath("//form[@id='loginForm']/input[1]")
username = driver.find_element_by_xpath("//input[@name='username']")

第一个form元素中包含name属性并且其值为 username 的input元素
id为 loginForm 的form元素的第一个input子元素
第一个name属性为 username 的input元素

“Clear” 按钮可以如下获取:

clear_button = driver.find_element_by_xpath("//input[@name='continue'][@type='button']")
clear_button = driver.find_element_by_xpath("//form[@id='loginForm']/input[4]")

Input with attribute named name and the value continue and attribute named type and the value button
Fourth input child element of the form element with attribute named id and value loginForm

这些实例都是一些举出用法, 为了学习更多有用的东西，下面这些参考资料推荐给你:

W3Schools XPath Tutorial
W3C XPath Recommendation
XPath Tutorial - with interactive examples.

还有一些非常有用的插件，可以协助发现元素的XPath:

XPath Checker - suggests XPath and can be used to test XPath results.
Firebug - XPath suggestions are just one of the many powerful features of this very useful add-on.
XPath Helper - for Google Chrome

通过链接文本获取超链接

当你知道在一个锚标签中使用的链接文本时使用这个。在该策略下，页面中第一个匹配链接内容锚标签会被匹配并返回。如果找不到任何元素，会抛出 NoSuchElementException 异常。

作为示例，页面元素如下所示:

<html>
 <body>
  <p>Are you sure you want to do this?</p>
  <a href="continue.html">Continue</a>
  <a href="cancel.html">Cancel</a>
</body>
<html>

continue.html 超链接可以被这样查找到:

continue_link = driver.find_element_by_link_text('Continue')
continue_link = driver.find_element_by_partial_link_text('Conti')

通过标签名查找元素

当你向通过标签名查找元素时使用这个。在该策略下，页面中第一个匹配该标签名的元素会被匹配并返回。如果找不到任何元素，会抛出 NoSuchElementException 异常。

作为示例，页面元素如下所示:

<html>
 <body>
  <h1>Welcome</h1>
  <p>Site content goes here.</p>
</body>
<html>

h1 元素可以如下查找:

heading1 = driver.find_element_by_tag_name('h1')

通过Class name 定位元素

当你向通过class name查找元素时使用这个。在该策略下，页面中第一个匹配该class属性的元素会被匹配并返回。如果找不到任何元素，会抛出 NoSuchElementException 异常。

作为示例，页面元素如下所示:

<html>
 <body>
  <p class="content">Site content goes here.</p>
</body>
<html>

p 元素可以如下查找:

content = driver.find_element_by_class_name('content')

通过CSS选择器查找元素

当你向通过CSS选择器查找元素时使用这个。在该策略下，页面中第一个匹配该CSS 选择器的元素会被匹配并返回。如果找不到任何元素，会抛出 NoSuchElementException 异常。

作为示例，页面元素如下所示:

<html>
 <body>
  <p class="content">Site content goes here.</p>
</body>
<html>

p 元素可以如下查找:

content = driver.find_element_by_css_selector('p.content')

Sauce 实验室有一篇很好的文档来介绍CSS选择器

等待页面加载完成(Waits)

现在的大多数的Web应用程序是使用Ajax技术。当一个页面被加载到浏览器时，该页面内的元素可以在不同的时间点被加载。这使得定位元素变得困难，如果元素不再页面之中，会抛出 ElementNotVisibleException 异常。使用 waits, 我们可以解决这个问题。waits提供了一些操作之间的时间间隔- 主要是定位元素或针对该元素的任何其他操作。

Selenium Webdriver 提供两种类型的waits - 隐式和显式。显式等待会让WebDriver等待满足一定的条件以后再进一步的执行。而隐式等待让Webdriver等待一定的时间后再才是查找某元素。

显式等待

显式等待是你在代码中定义等待一定条件发生后再进一步执行你的代码。最糟糕的案例是使用time.sleep()，它将条件设置为等待一个确切的时间段。这里有一些方便的方法让你只等待需要的时间。WebDriverWait结合ExpectedCondition 是实现的一种方式。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Firefox()
driver.get("http://somedomain/url_that_delays_loading")
try:
    element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "myDynamicElement"))
    )
finally:
    driver.quit()

在抛出TimeoutException异常之前将等待10秒或者在10秒内发现了查找的元素。 WebDriverWait 默认情况下会每500毫秒调用一次ExpectedCondition直到结果成功返回。 ExpectedCondition成功的返回结果是一个布尔类型的true或是不为null的返回值。

预期的条件

自动化的Web浏览器中一些常用的预期条件，下面列出的是每一个实现， Selenium Python binding都提供了一些方便的方法，这样你就不用去编写 expected_condition类或是创建至今的工具包去实现他们。 - title_is - title_contains - presence_of_element_located - visibility_of_element_located - visibility_of - presence_of_all_elements_located - text_to_be_present_in_element - text_to_be_present_in_element_value - frame_to_be_available_and_switch_to_it - invisibility_of_element_located - element_to_be_clickable - 显示并可用. - staleness_of - element_to_be_selected - element_located_to_be_selected - element_selection_state_to_be - element_located_selection_state_to_be - alert_is_present

from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10)
element = wait.until(EC.element_to_be_clickable((By.ID,'someid')))

expected_conditions 模块提供了一组预定义的条件供WebDriverWait使用。

隐式等待

如果某些元素不是立即可用的，隐式等待是告诉WebDriver去等待一定的时间后去查找元素。默认等待时间是0秒，一旦设置该值，隐式等待是设置该WebDriver的实例的生命周期。

from selenium import webdriver

driver = webdriver.Firefox()
driver.implicitly_wait(10) # seconds
driver.get("http://somedomain/url_that_delays_loading")
myDynamicElement = driver.find_element_by_id("myDynamicElement")

页面对象

本章是一个针对页面对象设计模式的教程引导。一个页面对象表示在你测试的WEB应用程序的用户界面上的区域。

使用页面对象模式的好处:

创建可复用的代码以便于在多个测试用例间共享
减少重复的代码量
如果用户界面变化，只需要修改一处

测试用例

下面是一个在python.org网站搜索一个词并保证一些结果可以找到的测试用例。

import unittest
from selenium import webdriver
import page

class PythonOrgSearch(unittest.TestCase):
    """A sample test class to show how page object works"""

    def setUp(self):
        self.driver = webdriver.Firefox()
        self.driver.get("http://www.python.org")

    def test_search_in_python_org(self):
        """
        Tests python.org search feature. Searches for the word "pycon" then verified that some results show up.
        Note that it does not look for any particular text in search results page. This test verifies that
        the results were not empty.
        """

        #Load the main page. In this case the home page of Python.org.
        main_page = page.MainPage(self.driver)
        #Checks if the word "Python" is in title
        assert main_page.is_title_matches(), "python.org title doesn't match."
        #Sets the text of search textbox to "pycon"
        main_page.search_text_element = "pycon"
        main_page.click_go_button()
        search_results_page = page.SearchResultsPage(self.driver)
        #Verifies that the results page is not empty
            assert search_results_page.is_results_found(), "No results found."

    def tearDown(self):
        self.driver.close()

if __name__ == "__main__":
    unittest.main()

页面对象类

页面对象为每个网页模拟创建出一个对象。按照此技术，在测试代码和技术实施之间的一个分离层被创建。

这个 page.py 看起来像这样:

from element import BasePageElement
from locators import MainPageLocators

class SearchTextElement(BasePageElement):
    """This class gets the search text from the specified locator"""

    #The locator for search box where search string is entered
    locator = 'q'


class BasePage(object):
    """Base class to initialize the base page that will be called from all pages"""

    def __init__(self, driver):
        self.driver = driver


class MainPage(BasePage):
    """Home page action methods come here. I.e. Python.org"""

    #Declares a variable that will contain the retrieved text
    search_text_element = SearchTextElement()

    def is_title_matches(self):
        """Verifies that the hardcoded text "Python" appears in page title"""
        return "Python" in self.driver.title

    def click_go_button(self):
        """Triggers the search"""
        element = self.driver.find_element(*MainPageLocators.GO_BUTTON)
        element.click()


class SearchResultsPage(BasePage):
    """Search results page action methods come here"""

    def is_results_found(self):
        # Probably should search for this text in the specific page
        # element, but as for now it works fine
        return "No results found." not in self.driver.page_source

页面元素

这个 element.py 看起来像这样:

from selenium.webdriver.support.ui import WebDriverWait


class BasePageElement(object):
    """Base page class that is initialized on every page object class."""

    def __set__(self, obj, value):
        """Sets the text to the value supplied"""
        driver = obj.driver
        WebDriverWait(driver, 100).until(
            lambda driver: driver.find_element_by_name(self.locator))
        driver.find_element_by_name(self.locator).send_keys(value)

    def __get__(self, obj, owner):
        """Gets the text of the specified object"""
        driver = obj.driver
        WebDriverWait(driver, 100).until(
            lambda driver: driver.find_element_by_name(self.locator))
        element = driver.find_element_by_name(self.locator)
        return element.get_attribute("value")

定位器

其中一个做法是，从它们正在使用的地方分离定位字符。在这个例子中，同一页面的定位器属于同一个类。

这个 locators.py 看起来像这样:

from selenium.webdriver.common.by import By

class MainPageLocators(object):
    """A class for main page locators. All main page locators should come here"""
    GO_BUTTON = (By.ID, 'submit')

class SearchResultsPageLocators(object):
    """A class for search results locators. All search results locators should come here"""
    pass

附录：常见问题

Another FAQ: https://github.com/SeleniumHQ/selenium/wiki/Frequently-Asked-Questions

如何使用 ChromeDriver ?

下载最新版本的 chromedriver. 解压缩这个文件:

unzip chromedriver_linux32_x.x.x.x.zip

你应该会看到一个 chromedriver 的可执行文件. 现在你可以像这样创建一个 Chrome WebDriver 实例:

driver = webdriver.Chrome(executable_path="/path/to/chromedriver")

这个示例的其余部分应该在其他的文档中给出。

Selenium 2是否支持XPath 2.0版本？

参考：http://seleniumhq.org/docs/03_webdriver.html#how-xpath-works-in-webdriver

Selenium代表的XPath查询基于浏览器自身的XPath引擎，所以Selenium支持任何支持XPath的浏览器。在不具备原生的XPath引擎（IE6,7,8）的浏览器，Selenium只支持XPath 1.0。

如何向下滚动到页面的底部？

参考: http://blog.varunin.com/2011/08/scrolling-on-pages-using-selenium.html

你可以在加载完成的页面上使用 execute_script 方法执行js。所以，你调用javascript API滚动到底部或页面的任何位置。

这里是一个滚动到页面底部的例子:

driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

该 window 对象在DOM有一个 scrollTo 滚动到打开窗口的任意位置的方法。该 scrollHeight 是所有元素的共同属性。该 document.body.scrollHeight 将给出整个页面体的高度。

如何使用自定义的Firefox 配置文件保存文件？

参考: http://stackoverflow.com/questions/1176348/access-to-file-download-dialog-in-firefox

参考: http://blog.codecentric.de/en/2010/07/file-downloads-with-selenium-mission-impossible/

第一步是要确认自动保存文件的类型。

要确定你想要自动下载的内容类型，你可使用 curl:

curl -I URL | grep "Content-Type"

找到内容类型的另一种方法是使用 [](#id4)requests <http://python-requests.org>模块，你可以像这样使用:

import requests
content_type = requests.head('http://www.python.org').headers['content-type']
print(content_type)

一旦内容类型被确认，你可以用它来设置firefox配置文件的偏好: browser.helperApps.neverAsk.saveToDisk 下面是一个例子:

import os

from selenium import webdriver

fp = webdriver.FirefoxProfile()

fp.set_preference("browser.download.folderList",2)
fp.set_preference("browser.download.manager.showWhenStarting",False)
fp.set_preference("browser.download.dir", os.getcwd())
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "application/octet-stream")

browser = webdriver.Firefox(firefox_profile=fp)
browser.get("http://pypi.python.org/pypi/selenium")
browser.find_element_by_partial_link_text("selenium-2").click()

在上面的例子中，application/octet-stream 被当作内容类型。

该 browser.download.dir 选项指定了你要下载文件的目录。

如果上传文件到文件上传控件？

选择 <input type="file"> 元素并且调用 send_keys() 方法传入要上传文件的路径，可以是对于测试脚本的相对路径，也可以是绝对路径。请牢记在Windows和Unix系统之间的路径名的区别。

如果在Firefox中使用firebug工具？

首先下载Firebug插件的XPI文件，然后调用对于firefox 的配置提供的 add_extension 方法

from selenium import webdriver

fp = webdriver.FirefoxProfile()

fp.add_extension(extension=’firebug-1.8.4.xpi’) fp.set_preference(“extensions.firebug.currentVersion”, “1.8.4”) #Avoid startup screen browser = webdriver.Firefox(firefox_profile=fp)

如果获取当前窗口的截图？

使用webdriver提供的 save_screenshot 方法:

from selenium import webdriver

driver = webdriver.Firefox()
driver.get('http://www.python.org/')
driver.save_screenshot('screenshot.png')
driver.quit()
e("browser.download.dir", os.getcwd())
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "application/octet-stream")

browser = webdriver.Firefox(firefox_profile=fp)
browser.get("http://pypi.python.org/pypi/selenium")
browser.find_element_by_partial_link_text("selenium-2").click()

在上面的例子中，application/octet-stream 被当作内容类型。

该 browser.download.dir 选项指定了你要下载文件的目录。

如果上传文件到文件上传控件？

如果在Firefox中使用firebug工具？

首先下载Firebug插件的XPI文件，然后调用对于firefox 的配置提供的 add_extension 方法

from selenium import webdriver

fp = webdriver.FirefoxProfile()

fp.add_extension(extension=’firebug-1.8.4.xpi’) fp.set_preference(“extensions.firebug.currentVersion”, “1.8.4”) #Avoid startup screen browser = webdriver.Firefox(firefox_profile=fp)

如果获取当前窗口的截图？

使用webdriver提供的 save_screenshot 方法:

from selenium import webdriver

driver = webdriver.Firefox()
driver.get('http://www.python.org/')
driver.save_screenshot('screenshot.png')
driver.quit()