CDH(Cloudera)与hadoop(apache)对比

本文出自:CDH(Cloudera)与hadoop(apache)对比http://www.aboutyun.com/thread-9225-1-1.html(出处: about云开发)
 

问题导读:

1.Hadoop有几个版本

2.CDH有几种安装方式

3.CDH在安装认证方面做了什么改变?

Cloudera的CDH和Apache的Hadoop的区别,目前而言,不收费的Hadoop版本主要有3个(均为国外厂商),分别是:Apache(最原始的版本,所有发行版均居于这个版本进行改进),Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称CDH),Hortonworks版本(Hortonworks Data Platform,简称"HDP"),对于国内而言,绝大多数选择CDH版本,CDH和Apache版本主要区别如下:

(1)CDH对Hadoop版本的划分非常清晰,只有两个系列的版本,分别是cdh3和cdh4,分别对应第一代Hadoop(Hadoop1.0)和第二代Hadoop(Hadoop2.0),相比而言,Apache的版本则混乱得多;比Apache hadoop在兼容性、安全性、稳定性上有增强。

(2)CDH3版本是基于Apache hadoop0.20.2改进的,并融入了最新的patch,CDH4版本是基于Apache hadoop2.x改进的,CDH总是并应用了最新Bug修复或者Feature的patch,并比Apache hadoop同功能版本提早发布,更新速度比Apache官方快。

(3)安全CDH支持Kerboros安全认证,apache hadoop则使用简陋的用户匹配认证

(4)CDH文档清晰,很多采用Apache版本的用户都会阅读CDH提供的文档,包括安装文档、升级文档等。

(5)CDH支持Yum/Apt包,Tar包,RPM包,CM安装,Cloudera Manager三种安装方式,Apcache hadoop只支持Tar包安装。

注:CDH使用推荐的Yum/Apt包安装时,有以下几个好处:

1.联网安装、升级,非常方便

2.自动下载依赖软件包

3.Hadoop生态系统包自动匹配,不需要补寻找与当前Hadoop匹配的Hbase,Flume,Hive等软件,Yum/Apt会根据当前安装Hadopp版本自动寻找匹配版本的软件包,并保证兼容性。

4.自动从黄建相关目录并软连接到合适的地方(如conf和logs等目录);自动创建hdfs,mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。

原文地址:https://www.cnblogs.com/jingblogs/p/5498928.html