Hadoop分布式系统解析

写在前面:由于自己学习Hadoop有一段时间,也结合3本关于分析hadoop的书籍和源码对hadoop进行一定的研究,所以在此情况下讲自己对hadoop的学习情况进行分步的写出来,也算是对之前的总结,以便日后能够举一反三,更深入更完整了解hadoop的各个方面。附一张关于hadoop分布式系统的图出来。


分别从下往上开始对hadoop Ecosystem进行总结

1、HDFS

2、MapReduce

3、HBase

4、Hive

5、ZooKeeper

6、Pig

7、Sqoop

8、ETL Tools --- Kettle


在写这个得时候hadoop已经即将发布它的第二版YARN,不禁感叹技术革新之快真是难以想象,不过无论再新的技术,打好基础才是关键,否则浮于表面最终还是难以上得了台面吧。希望也能够一次自省。

原文地址:https://www.cnblogs.com/jeromesunny/p/3199132.html