大数据调优

1.distrbute by rand()或者加表中字段 

           distribute by是控制在map端如何拆分数据给reduce端的。hive会根据distribute by后面列,对应reduce的个数进行分发,默认是采用hash算法

原文地址:https://www.cnblogs.com/handsome-24/p/11750673.html