程序员必须要知道的Hadoop的一些事实

程序员必须要知道的Hadoop的一些事实。现如今,Apache Hadoop已经无人不知无人不晓。当年雅虎搜索工程师Doug Cutting开发出这个用以创建分布式计算机环境的开源软......

1:Hadoop是由多个产品组成的。

2:Apache Hadoop是开源技术,但专有厂商也提供Hadoop产品。

3:Hadoop是一个生态系统,而非一个产品。

4:HDFS是文件系统,而不是数据库管理系统。

5:Hive与SQL类似,却非标准SQL。

6:Hadoop与MapReduce相互关联,但不相互依赖。

7:MapReduce提供的是对分析的控制,而不是分析本身。

8:Hadoop的意义不仅仅在于数据量,更在于数据的多样化。

9:Hadoop是数据仓库的补充,不是数据仓库的替代品。

10:Hadoop不仅仅是Web分析。

11:大数据不一定非Hadoop不可。

12:Hadoop不是“免费午餐”。

最后告知大家:“千万别以为Hadoop是免费的或者很便宜,它背后的隐性开销你是一下子看不到的。”

原文地址:https://www.cnblogs.com/wangyayun/p/6201319.html