91家纺

"""
抓取
解析
存储
"""
import re
import ast
from urllib import parse
from datetime import datetime

import requests
from scrapy import Selector

domain = "http://www.91jf.com/"

def write_txt():
    f = open("a.txt", 'w')
    f.write("hello world")
    f.close()

def get_nodes_json():
    left_menu_text = requests.get("http://www.91jf.com/").text
    sel = Selector(text=left_menu_text)
    all_divs = sel.xpath("//div[@class='class_child_li']//a/@herf")
    #nodes_str_match = re.search(r"(<li><a href=".*>)", left_menu_text)
    print(all_divs)
    #print(nodes_str_match.groups())
    '''
    if nodes_str_match:
        nodes_str = nodes_str_match.group(1).replace("null", "None")
        nodes_list = ast.literal_eval(nodes_str)
        return nodes_list
    return []
    '''

if __name__ == "__main__":
    get_nodes_json()
原文地址:https://www.cnblogs.com/dog-and-cat/p/13204277.html