添加功能

text =file.readlines()  # 结果为str类型
for line in text:#遍历文件
    print("开始爬取评论")
    name = line.split()[0]

加了个功能自动遍历网址目录进行爬取

然后接下来就是多爬取数据,然后进行数据清洗,清洗部分不符合格式要求的数据

最后分析可视化等等

原文地址:https://www.cnblogs.com/520520520zl/p/15774747.html