Map-Reduce基础

1.设置文件读入分隔符

默认按行读入;

按句子读入 : conf1.set("textinputformat.record.delimiter", ".");

2.set up 方法

此方法被MapReduce框架仅且执行一次,在执行Map任务前,进行相关变量或者资源的集中初始化工作。

若是将资源初始化工作放在方法map()中,导致Mapper任务在解析每一行输入时都会进行资源初始化工作,导致重复,程序运行效率不高!

原文地址:https://www.cnblogs.com/futurehau/p/6055926.html