hive一些基本用法

1.hive中的数据库表的类型有两种,一种是managed,一种是external  :managed表类型是指传入的数据放在hive默认的储存位置下,而external 表类型可以将数据 放在任意的目录下存储
managed类型的table当删除时会将表数据以及文件夹都删掉,而external类型的表则只是删除元数据,而不会删除原本的数据(言外之意就是把文件中的数据不作为数据库里的数据)



有hdfs向hive是数据仓库中导入数据的语句   :load data inpath '/uuu.dat' into table t_order;
2.hive中不支持像表中插入一条数据,但是可以用下列语法批量插入(可用于向临时表中 追加中间数据)
insert overwrite table tab_ip_like  (将文件里的数据覆盖掉)
insert into table tab_ip_like(向文件中的数据中追加数据,而不是覆盖)
3.partition(分区)
create table t_order(id int,name string,rongliang string,price double)
partition by (month string)
row format delimited fields terminated by ' ';

4.hive中除了支持普通的数据类型外,还支持一些特殊的数据类型,比如数组,map,struct(结构体),
5.hive中还支持自定义函数,只要将其封装好导出为jar包,再将其放入hive根目录下的lib中,便可以使用该jar包,即自定义的函数。

原文地址:https://www.cnblogs.com/ljysy/p/9643634.html