spark总结4 算子问题总结

官网上最清晰

 sc 启动spark时候就已经初始化好了

sc.textFile后 会产生一个rdd

spark 的算子分为两类

  一类 Transformation  转换

  一类 Action  动作

Transformation  延迟执行 记录元数据信息     当计算任务触发Action时候才会真正的开始计算

原文地址:https://www.cnblogs.com/toov5/p/7530695.html