1、在Windows本地通过java程序对现有日志信息进行清洗得到,想要的数据结构;
2、通过hive语句
create external table if not exists result(ip string,day string,traffic bigint,type string,id strinelimited fields terminated by ',' location '/home.txt';
创建数据表
通过load data local inpath '/home/hadoop/result.txt' overwrite into table result; 将数据
导入到hive数据仓库中;
3、通过查询语句检查结果
导入成功。