python爬虫常用数据整理函数

text()                       获取xpath中的值。...../h1/text()


extract()[0]              Selector的方法用于提取内容为一个数组。


extract_first("")        与extract()[0]相同更加准确


contains()     匹配一个属性值中包含的字符串 contains(@class, 'vote-post')


strip()        把头和尾的空格去掉


lstrip()       把左边的空格去掉


rstrip()         把右边的空格去掉


replace('c1','c2')   把字符串里的c1替换成c2。故可以用replace(' ','')来去掉字符串里的所有空格


split()       通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串

原文地址:https://www.cnblogs.com/wfnj/p/10794892.html