周进度报告(三)

本周利用进行了DataX和kettle的实战,利用dataX和kettle对csv格式的数据源进行了清洗,将其导入到了MySQL数据库中,并对数据进行了查重。利用自己学习了一些Python的爬虫,爬取了新闻网站的标题和地址。

原文地址:https://www.cnblogs.com/1gaoyu/p/12458312.html