hive 分区表与数据产生关联的三种方式

所谓关联,可以理解为能够使用select查询到

1.load

这是最常用的一种方式

load data [local] inpath "数据路径" into table table_name partition(分区字段)

使用load加载数据会自动创建分区的,这样你加载的数据就会和分区表进行关联,之后select就可以了

2.修复命令

这种方式是先使用hive创建分区目录,然后用put上传数据,最后使用msck repair进行修复,所谓修复实质是创建分区,即Added partition to metastore ...

dfs -mkdir -p  "分区路径"

dfs -put  "数据路径" "分区路径"

最后修复

msck repair table table_name

3.上传数据后使用alter增加分区

dfs -mkdir -p  "分区路径"

dfs -put  "数据路径" "分区路径"

alter table table_name add partition(xxx)

之后也可以查询到

综上,load方式最为简洁

原文地址:https://www.cnblogs.com/tele-share/p/9829515.html