小记----采集之Xpath

一、XPATH简介
  Xpath是XML路径语言,它是一种确定XML文档中某部分位置的语言
二、XPATH语法
 XPATH使用路径表达式在XML文档中选取节点。节点是通过沿着路径或者step来选取的。
 
/div/a[1]
选取属于div的子元素第一个a元素
/div/a[last()]
选取属于div的子元素的最后一个a元素
/div/a[last()-1
选取属于div的子元素的倒数第二个a元素
/div/a[position()<3]
选取属于div的子元素的前两个a元素
//title[@lang]
选取所有含有lang属性的title元素
//title[@lang='eng']
选取所有lang属性是eng的title元素
//div/a[price>35]
选取属于div的子元素a且price的值大于35的元素
/bookstore/book[price>35.00]/title
选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。
 
 
选取未知节点
/div/*
选取div元素的所有子元素
//*
选取所有元素
//title[@*]
选取所有带属性的title元素
 
选取若干路径
//book/title | //book/price
选取book中所有title和price元素
//title | //price
选取所有的title和price元素
/books/book/title | //price
选取books元素的book元素的所有title元素和文档中所有price元素
 
安装谷歌XPATH插件
标签页输入chrome://extensions/  打开开发者工具选项。 然后把下载的XPATH插件拖进去即可,
 
 
  
 
原文地址:https://www.cnblogs.com/yzqyxq/p/11574902.html