spark快速大数据分析

从上层来看，每个Spark 应用都由一个驱动器程序（driver program）来发起集群上的各种并行操作。驱动器程序包含应用的main 函数，并且定义了集群上的分布式数据集，还对这些分布式数据集应用了相关操作。

驱动器程序通过一个SparkContext 对象来访问Spark。这个对象代表对计算集群的一个连接.

一旦有了SparkContext，你就可以用它来创建RDD.

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/playforever/p/9759323.html