HIVE 大表JOIN大表优化方法

今天遇到了百亿级别的数据量JOIN  十亿级别的数据量 发现reduce 40分钟还没有出来,进去看单个task 某些task要30min+才能跑完成

原文地址:https://www.cnblogs.com/pengpenghuhu/p/14828157.html