Hadoop生态圈-CDH与HUE使用案例

            Hadoop生态圈-CDH与HUE使用案例

                                   作者:尹正杰

版权声明:原创作品,谢绝转载!否则将追究法律责任。

一.HUE的介绍

1>.HUE的由来

  HUE全称是HadoopUser Experience,看这名字就知道怎么回事了吧。没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用HUE我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。

2>.HUE的好处

  通过使用HUE我们可以在浏览器端的Web控制太上与Hadoop集群进行交互来分析处理数据。例如操作Hdfs上的数据,运行Hive脚本,管理Oozie或Azkaban任务调度等等。由于HUE是一个开源的Apache Hadoop UI系统。因此它支持任何版本Hadoop。

3>.HUE的功能

  3.1>.基于文件浏览器(File Browser)访问HDFS;
  3.2>.基于WEB编辑器来开发和运行Hive查询;
  3.3>.支持基于Solr进行搜索的应用,并提供可视化的数据视图,报表生成;
  3.4>.通过web调试和开发impala交互式查询;
  3.5>.spark调试和开发;
  3.6>.Pig开发和调试;
  3.7>.oozie任务的开发,监控,和工作协调调度;
  3.8>.HBase数据查询和修改,数据展示;
  3.9>.MapReduce任务进度查看,日志追踪;
  3.10>.创建和提交MapReduce,Streaming,Java job任务;
  3.11>.Sqoop2的开发和调试;
  3.12>.Zookeeper的浏览和编辑;
  3.13>.数据库(MySQL,PostGres,SQlite,Oracle);

4>.官网地址

  HUE官网地址可参考:http://gethue.com/overview/。

二.在CDH中添加HUE服务(HUE对Hive和Oozie有依赖,因此在安装它之前需要安装这两个服务)

1>.安装hive和oozie

2>.

3>.

4>.

5>.

原文地址:https://www.cnblogs.com/yinzhengjie/p/9653317.html