20211025一周的计划

部分一:

通过原有的接口,继续进行数据的爬取操作,让自己使用接口更加熟练,收集的数据集,达到最少五十万以上(最好100万以上)。

部分二:

通过我获取的文档信息,对支持下载的数据文档进行下载,做到能下载的尽量全部下载下来。

部分三:

按类型进行文档的爬取例如:人工智能、大数据等等。
按作者进行文档的爬取例如:张三、李四等等

部分四:

梳理自己的思路,完善自己的开题报告和毕设开题ppt

部分五:

初步对摘要的内容进行关键字的提取等操作。

原文地址:https://www.cnblogs.com/dazhi151/p/15463297.html