Hive 基本操作

1.创建一个表

(字段表名不加引号‘,分隔符需要加引号)

create table t1(
    id      int
   ,name    string
   ,hobby   array<string>
   ,add     map<String,string>
)
partitioned by(
dt date
)
row format delimited
fields terminated by ','
collection items terminated by '-'
map keys terminated by ':'
;

2.插入数据

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1,partcol2=val2 ...)]

·filepath 可以是:
    相对路径,如project/data1
    绝对路径,如/user/hive/project/data1
    完整的URL,如hdfs://namenode:9000/user/hive/project/data1
    目标可以是一个表或是一个分区。如果目标表是分区表,必须指定是要加载到哪个分区。
    filepath 可以是一个文件,也可以是一个目录(会将目录下的所有文件都加载)。
·如果命令中带LOCAL,表示:
    load命令从本地文件系统中加载数据,可以是相对路径,也可以是绝对路径。对于本地文件系统,也可以使用完整的URL,如file:///user/hive/project/data1
    load命令会根据指定的本地文件系统中的filepath复制文件到目标文件系统,然后再移到对应的表
    如果命令中没有LOCAL,表示从HDFS加载文件,filepath可以使用完整的URL方式,或者使用fs.default.name定义的值
·命令带OVERWRITE时加载数据之前会先清空目标表或分区中的内容,否则就是追加的方式。

3.删除表中数据

(1)按分区删除

ALTER TABLE test1  DROP PARTITION (dt='2016-04-29');

(2)清空表

insert overwrite table t_table1 select * from t_table1 where 1=0;

TRUNCATE TABLE table_name

(3)连同表一起删除

DROP TABLE [IF EXISTS] table_name  ;
原文地址:https://www.cnblogs.com/yuanmingzhou/p/9957029.html