初识Hadoop

Hadoop生态特点:

  开源,社区活跃

  囊括了大数据的方方面面

  成熟的生态圈

Hadoop常用的发型版本:

  1 Apache Hadoop

    - - 原生态的Hadoop。容易产生jar包冲突问题,难以解决。

  2 CDH

    - - CM组件,易安装,集群易搭建,易升级易管理,文档优秀,统一版本规避jar包冲突,缺点CM框架不开源。

  3 HDP

    - -使用原装Hadoop,纯开源。安装升级没有CDH方便

优选CDH。

Hadoop企业应用案例:

  大数据分析,预测某些用户的需求,提前发货。

  商品零售:大数据分析,建立模型,用户画像,精准营销。

原文地址:https://www.cnblogs.com/woyaobianfei/p/9211938.html