RDD

RDD:Resilient Distributed Dataset,弹性分布式数据集;

创建、转换、操作

转化操作和行动操作的区别在于 Spark 计算 RDD 的方式不同。它们只有第一次在一个行动操作中用到时,才会真正计算。

原文地址:https://www.cnblogs.com/mzzcy/p/7388890.html