hive—UNION ALL和UNION区别,以及性能最优用法

UNION ALL:不去重不排序直接原表合并。
UNION:先表合并、再去重、再排序。<=>作用等价于 先distinct去重、再UNION ALL表合并、再order by排序。 
但是效率,后者是前者的3倍。
所以,数据量大时,不建议直接用UNION,建议先去重再UNION ALL。


生活其实也很简单,喜欢的就去争取、得到的就珍惜、失去的就忘记。
原文地址:https://www.cnblogs.com/Formulate0303/p/15796992.html