hive中,动态添加map和reduce的大小,以增加并行度

map是配置mapred.max.split.size,来定义map处理文件的大小,默认是256000000字段,换算就是256M。  如果想增加map的并行度,那么就是减少map处理文件的大小即可。 即set mapred.max.split.size=xxx(更小的字节)

reduce和map是一致的,修改hive.exec.reducers.bytes.per.reducer这个参数

hive.exec.reducers.bytes.per.reducer

通过控制这个来定义一个reduce处理文件的大小。

原文地址:https://www.cnblogs.com/hark0623/p/7112701.html