Spark RDD RDD(Resilient Distributed Dateset),弹性分布式数据集。 ◆哪里体现RDD的弹性? 1.partition的个数可多可少 2.RDD之间有依赖关系 ◆哪里体现RDD的分布式? RDD中的partition是分布在多个节点上的