Spark中的transform, mappartions, foreachPartion,foreachRDD

rdd.mapPartitions与Dstream.transform需要返回值RDD, 是转换算子(存在重复计算的问题)
rdd.foreachPartion与Dstream.foreachRDD不需要返回值, 是行动算子

注意:
如果没有缓存, 没调用一次行动算子, 都会对涉及到的转换算子计算一次.
原文地址:https://www.cnblogs.com/bitbitbyte/p/13023864.html