hadoop——数据清洗测试

测试要求:

1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。

清洗前:

清洗后:

数据上传到hive:

 一开始问题出在hive,版本太高和太低都很容易 出问题,经过卸载安装等反复操作,终于可以了。mysql也是,最后jar包不匹配也可运行~安装好以后,在hive-site配置文件里的的username和password作为用户名和密码,连接了本地的navicat。第一部分完成了!

原文地址:https://www.cnblogs.com/zmh-980509/p/11854411.html