Spark RDD

RDD(Resilient Distributed Dateset),弹性分布式数据集。

◆哪里体现RDD的弹性?

  • 1.partition的个数可多可少
  • 2.RDD之间有依赖关系

 

◆哪里体现RDD的分布式?

  • RDD中的partition是分布在多个节点上的
原文地址:https://www.cnblogs.com/144823836yj/p/10767003.html