hadoop

hadoop集群管理工具? 
 puppet 
python
 

把其中一张表拆分为几个小表,目的是把一张表和一张表的关联转换为多张小表和一张表的关联,最后合并

 Hive中有分区的概念  可以将大的表按照日期或者地域之类的进行分区 这样在在连接的时候 中间结果能小很多  
spring-data-hadoop
原文地址:https://www.cnblogs.com/sode/p/3197442.html