Impala 高性能、低延迟的大数据查询引擎

Impala是什么?

Impala提供对大数据更快速,交互式 SQL查询。

Impala支持对存储在HDFS、HBase及S3等数据查询。

Impala使用和Hive相同的元数据、SQL定义、ODBC驱动及用户接口。

Impala提供实时、批数据的统一查询平台。

Impala是对现有大数据查询工具的补充,不能替代基于Hive的MapReduce批处理任务框架(适用于耗时长的批处理任务,例如ETL等)。

Impala建立在集群之上的分布式查询,易于扩展。

 

数据查询过程:

数据文件读写。

接受来自 impala-shell、Hue、JDBC、ODBC的查询语句。

集群并行执行查询。

返回结果。

 

Impala fr:

详细参阅:https://impala.apache.org/docs/build/html/index.html

 

原文地址:https://www.cnblogs.com/niejunlei/p/12833693.html