scrapy提取不在标签内文字

response.xpath(u’//span[./text()=”出版社:”]/following::text()[1]’)


如果text() 中有空格, 感谢 @董成良 提醒, 你可能还需要这么写response.xpath(u’//span[contains(./text(), “出版社:”)]/following::text()[1]’)


或者全匹配:response.xpath(u’//span[.//text()[normalize-space(.)=”出版社:”]]/following::text()[1]’)

弱鸡一枚,拿来引用

作者:足兆叉虫
链接:https://www.zhihu.com/question/38080188/answer/75103879
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

如果用xpath,chrome里有个小技巧。

这里写图片描述

原文地址:https://www.cnblogs.com/zswbky/p/8454095.html