【Spark实战高手之路-从零开始 读书笔记】前言

要想成为Spark高手,需要经历6个阶段:

1、熟练的掌握Scala语言

2、精通Spark平台本身提供给开发者的API

3、深入Spark内核

4、掌握基于Spark上的核心框架应用

5、做商业级别的Spark项目

6、提供Spark解决方案 

第一阶段

由于Spark框架是采用Scala语言编写的,因此最快速和支持最好的API依然并将永远是Scala方式的API,所以你必须掌握Scala来编写复杂的和高性能的Spark分布式程序。尤其要熟练掌握Scala的trait、apply、函数式编程,泛型、逆变和协变等。

推荐课程“精通Spark开发语言:Scala最佳实践”

第二阶段

掌握Spark中面向RDD的开发模式,掌握各种transformation和action函数的用法

掌握Spark中狂依赖和债以来以及lineage机制

掌握RDD的计算流程,如stage的划分、Spark应用陈旭提交给集群的基本过程以及工作原理

推荐课程“18小时内掌握Spark:把云计算大数据速度提高100倍以上课程”

http://www.mamicode.com/info-detail-379871.html

原文地址:https://www.cnblogs.com/baodaren/p/6484949.html