xpath用发

xpath的更多语法: https://docs.microsoft.com/zh-cn/previous-versions/dotnet/netframework-2.0/ms256039(v=vs.80)?redirectedfrom=MSDN

1.获取文本

html/head/title/text()  #  获取html下head下title的文本  获取title下的文本 文本里不包含下一级
html/head/title//text()  # 获取title下所有的文本 包含下一级的文本

head/link/@href   # 获取head下的link的href属性

//标签名[@属性名="属性值"]

//section[@id="list"]/section//div[@class="_20vb2"]/p/text()

html/head/./../body

//a[text()="下一页"]/@href   # 根据下一页文本获取a标签链接地址

html.xpath("//li[contains(@class,'item-1')]/a/@href")  # class要用小括号包住