python 根据中文表头标题抓取动态(表格)文档数据

思路

如图左侧表头标题,要获得右侧数据。网页数据提取成汉字,表格数据间会有空格,用split()分隔成list。用index()查找某个汉字表头位置,输出list下一个位置既是要得到值

    text2 ='网页纯文本,爬虫数据自己转换'
    # 字符串分割成列表,Python 分割字符串使用 变量.split("分割标示符号"[分割次数]),分割次数表示分割最大次数,为空则分割所有。
    list2 = text2.split()
    #列表根据内容查找某个值的位置,list2为列表的名字,p是查找的值在list的位置
    p = list2.index('查找的值,如管理规模区间')
    # v就是要获取的值,如20-50亿元
    v = list2[p + 1]  

  

原文地址:https://www.cnblogs.com/hiit/p/15439119.html