hadoop-处理小文件

一个Hadoop程序的优化过程 – 根据文件实际大小实现CombineFileInputFormat

http://www.rigongyizu.com/hadoop-job-optimize-combinefileinputformat/

mapreduce job让一个文件只由一个map来处理

http://www.rigongyizu.com/mapreduce-job-one-map-process-one-file/

Hadoop : 一个目录下的数据只由一个map处理

http://www.rigongyizu.com/hadoop-one-map-process-one-directory/

原文地址:https://www.cnblogs.com/sunxucool/p/3972687.html