hive的使用和深化理解

1.hive中的数据最终是存放在hdfs上的

2.hive本身不是关系型数据库,hive执行sql语句时会把sql语句翻译成mapreduce程序,然后将mapreduce程序提交到hadoop集群中去执行mapreduce程序

3.bin目录下启动hive:./hive后

hive>

接下来导入数据

vi emp.txt

hive>load data local inpath '/root/emp.txt' into table t_emp;

导入数据以后,可以在/user下看到一个hive目录,因为之前配置好了环境变量,它可以知道Hadoop在哪里,读取Hadoop的配置文件

在HDFS中找目录:/user/hive/warehouse/t_emp,可以找到一个emp.txt文件

所以hive的数据最终在HDFS上

hive>select count(*) from t_emp;

  select count(*) from t_emp where dept_name='销售部' group by dept_name;

  相当于把sql语句转换成mapreduce程序进行执行

  desc t_emp;(可以看到表结构)

 select * from t_emp;(只有查所有数据的时候才不会执行mapreduce,而是将整张表列出来)

原文地址:https://www.cnblogs.com/Mandylover/p/5210705.html