hadoop HDP和CDH版本比较

一.hadoop版本概述

不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进),Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH),

Hortonworks版本(Hortonworks Data Platform,简称“HDP”),目前使用最多的是HDP与CDH版本.

二.HDP与CDH版本比较

1. 据个人了解HDP是100%完全开源的,而CDH还不是100%完全开源。Hortonworks的工程师是社区的主要贡献者,Cloudera的发行版本也是比较清晰的。

2. HDP使用开源工具Ambari安装,CDH使用Cloudera Manager工具安装。对配置的修改与更新我喜欢Ambari的界面,可以很方便的修改集群配置,Cloudera Manager的配置界面真的是太烂了,不方便,发现有些配置竟然没法改。

3. 支持的组件,HDP基本上支持所有的开源大数据组件,CDH也基本上支持所有的开源大数据组件。

4. 代码包依赖,如果是HDP平台,编写代码直接依赖hadoop版本即可,如果是CDH平台,编写代码要依赖cdh的版本,否则运行不成功,这是坑啊。

三.版本选择

1. 是否为开源软件,即是否免费。

2. 是否有稳定版,这个一般软件官方网站会给出说明。

3. 是否经实践验证,这个可通过检查是否有一些大点的公司已经在生产环境中使用知道。

4. 是否有强大的社区支持,当出现一个问题时,能够通过社区、论坛等网络资源快速获取解决方法。

四.安装参考

1. https://docs.hortonworks.com/ HDP

2. https://www.cloudera.com/documentation.html CDH

原文地址:https://www.cnblogs.com/chong-zuo3322/p/12794982.html