Hive 基本操作

1.创建一个表

（字段表名不加引号‘，分隔符需要加引号）

create table t1(
    id      int
   ,name    string
   ,hobby   array<string>
   ,add     map<String,string>
)
partitioned by(
dt date
)
row format delimited
fields terminated by ','
collection items terminated by '-'
map keys terminated by ':'
;

2.插入数据

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1,partcol2=val2 ...)]

·filepath 可以是：
相对路径，如project/data1
绝对路径，如/user/hive/project/data1
完整的URL，如hdfs://namenode:9000/user/hive/project/data1
目标可以是一个表或是一个分区。如果目标表是分区表，必须指定是要加载到哪个分区。
filepath 可以是一个文件，也可以是一个目录(会将目录下的所有文件都加载)。
·如果命令中带LOCAL，表示：
load命令从本地文件系统中加载数据，可以是相对路径，也可以是绝对路径。对于本地文件系统，也可以使用完整的URL，如file:///user/hive/project/data1
load命令会根据指定的本地文件系统中的filepath复制文件到目标文件系统，然后再移到对应的表
如果命令中没有LOCAL，表示从HDFS加载文件，filepath可以使用完整的URL方式，或者使用fs.default.name定义的值
·命令带OVERWRITE时加载数据之前会先清空目标表或分区中的内容，否则就是追加的方式。

3.删除表中数据

（1）按分区删除

ALTER TABLE test1  DROP PARTITION (dt='2016-04-29');

（2）清空表

insert overwrite table t_table1 select * from t_table1 where 1=0;

TRUNCATE TABLE table_name

（3）连同表一起删除

DROP TABLE [IF EXISTS] table_name  ;