mapreduce核心原理

1:第一阶段:

第一阶段的task每一个nodemanager并发运行程序,完全并发,各不影响。这就是map阶段 运行的task时maptask

2:第二个阶段的task并发实例互不相干,但是他们的数据依赖与上一个阶段的task的输出。这时reduce阶段,运行的时reduce task。

原文地址:https://www.cnblogs.com/zhangweilun/p/6102361.html