xpath 在firefox,chrome中正常,在requests中不正常的解决。

经多次测试发现:

lxml中的etree格式化以后,直接使用firefox或chrome提取的xpath检索不到内容。

主要是因为tbody

# 车种xpath
czxx = '/html/body/table/tbody/tr/td/table/tbody/tr[1]/td[7]'
# 车型xpath
cxxx = '/html/body/table/tr/td/table/tr[1]/td[5]'

看上面两个,去掉tbody就可以了。

上面两个xpath是用firefox提取的。

下面是chrome提取的,也是要去掉tbody

# 车种xpath
czxx = '//*[@id="report1"]/tr[1]/td[7]'
# 车型xpath
cxxx = '//*[@id="report1"]/tr[1]/td[5]'
原文地址:https://www.cnblogs.com/jackadam/p/10112960.html