Hadoop作业优化

mapper数量

reduce数量

combiner

中间值压缩

自定义序列

调整shuffle,减少溢出写

关闭推测执行

任务JVM重用

慢启动reduce

原文地址:https://www.cnblogs.com/zhangeamon/p/5759562.html