大数据调优

1.distrbute by rand()或者加表中字段

distribute by是控制在map端如何拆分数据给reduce端的。hive会根据distribute by后面列，对应reduce的个数进行分发，默认是采用hash算法

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/handsome-24/p/11750673.html