1 Hadoop原理介绍 笔记一

海量数据的存取 hdfs hadoop distributed file system 分布式文件系统)

海量数据的分析 mapReduce (并行计算框架)

Yarn (yet another resource negotiator 资源管理调度系统)

Hadoop处理离线数据

Storm实时的流处理(如实时推荐)

解决海量数据计算  1+2+3+4+5+6+7+8+9

Map: 1+2+3  4+5+6  7+8+9

Reduce: 6+15+24

Hadoop集群物理结构

单节点物理结构

Master: 可能是运行了nameNode  secondary nameNode   jobTracker

Slave: TaskTracker  nataNode

原文地址:https://www.cnblogs.com/retacn-yue/p/6194232.html