xpath

1.根元素 /

必须逐层依次往下找,这个方式像是文件路径查找文件

listUrlA = response.xpath("/html/head/title/text()").extract()

2.直接定位元素 //

不需要每一层的路径都写上,直接查找它下面所有的标签

listUrlA = response.xpath("//title/text()").extract()

3.text()

只查找当前标签内的文字,不查找标签的属性和子标签的内容

*另

想查看所有内容末尾不要加/ 也不要加text()

4.@ 按标签的属性查找

按标签属性查找

//div[@id]

查找所有div标签的id属性值是content的

//div[@id='content']//span/text()

5.查找指定位置的元素

查找xx下的第2个span标签

../span[2]

查找xx下的倒数第二个span

../span[last()-1]

查找xx下的前二个span

../span[last()<3]

6.通配符

7.

原文地址:https://www.cnblogs.com/buchizaodian/p/10417370.html