hadoop hadoop集群管理工具? puppet python 把其中一张表拆分为几个小表,目的是把一张表和一张表的关联转换为多张小表和一张表的关联,最后合并 Hive中有分区的概念 可以将大的表按照日期或者地域之类的进行分区 这样在在连接的时候 中间结果能小很多 spring-data-hadoop