写在前面:由于自己学习Hadoop有一段时间,也结合3本关于分析hadoop的书籍和源码对hadoop进行一定的研究,所以在此情况下讲自己对hadoop的学习情况进行分步的写出来,也算是对之前的总结,以便日后能够举一反三,更深入更完整了解hadoop的各个方面。附一张关于hadoop分布式系统的图出来。
分别从下往上开始对hadoop Ecosystem进行总结
1、HDFS
2、MapReduce
3、HBase
4、Hive
5、ZooKeeper
6、Pig
7、Sqoop
8、ETL Tools --- Kettle
在写这个得时候hadoop已经即将发布它的第二版YARN,不禁感叹技术革新之快真是难以想象,不过无论再新的技术,打好基础才是关键,否则浮于表面最终还是难以上得了台面吧。希望也能够一次自省。