在cm安装的大数据管理平台中集成impala之后读取hive表中的数据的设置(hue当中执行impala的数据查询)

今天装了CM集群,在集群当中集成了impala,hive。然后一直觉得认为impala自动共享hive的元数据,最后发现好像并不是这样的,需要经过一个同步元数据的操作才能实现数据的同步。

具体的做法如下:

(1)安装好hive和impala,然后在hive当中创建目标数据库,创建一张表

[root@VM200-120 ~]# impala-shell  (通过shell的形式进入到impala的命令行当中)

2. 在Impala中同步元数据(这里的元数据是hive当中的元数据)

[VM200-120:21000] > INVALIDATE METADATA;

然后我们去hue的管理界面就可以看到impala当中已经同步了hive当中的数据。可以对数据进行操作了:

原文地址:https://www.cnblogs.com/gxgd/p/10050315.html