为什么很多企业的大数据业务都基于Hadoop方案

无论国内外,大公司对数据都有着无穷无尽的渴望,随着业务开展,数据来源越来越多,数据格式多样,体量也越来越大,因此基于结构化数据的关系型数据库很快趋于瓶颈。公司们都在思考着如何寻找一个合适的工具来解决大数据量下的计算和存储问题。你可能会想到超算和HPC,但只有几个巨头玩得起,中小企业基本很难承担其自建费用。后来,谷歌连发了3篇关键性的论文:GoogleFS, MapReduce和BigTable,给各大公司指明了一个在大规模计算和存储上的方向,随后雅虎又将MapReduce, hdfs和Hbase开源到Hadoop生态中,这标志着Hadoop正式进入人们视野。

后来,不仅是中小企业,其他大型公司也开始关注并加入到Hadoop社区,进而产生连带效应,使其快速发展壮大起来。过去一段时间,以kubernetes为代表的微服务正在逐步替代Hadoop的部分功能,但Hadoop生态的丰富和完整性在短时间内是很难被替代的。

Hadoop架构在廉价的硬件服务器上,不需要按昂贵的硬件做支撑;产品开源免费。

所以,选择Hadoop的原因最重要的就是这3点:可以解决问题,成本低,成熟的生态圈。

原文地址:https://www.cnblogs.com/tongying/p/14452578.html