学习进度-11 RDD 编程初级实践

一、

请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt,该数据集包含
了某大学计算机系的成绩,数据格式如下所示:
Tom,DataBase,80
Tom,Algorithm,50
Tom,DataStructure,60
Jim,DataBase,90
Jim,Algorithm,60
Jim,DataStructure,80
……
请根据给定的实验数据,在 spark-shell 中通过编程来计算以下内容:

1.先运行spark,进入shell界面

 1该系总共有多少学生

 2该系共开设来多少门课程

 3Tom 同学的总成绩平均分是多少

 4求每名同学的选修的课程门数

265行,不一一粘贴了

5该系 DataBase 课程共有多少人选修

 6各门课程的平均分是多少

 7使用累加器计算共有多少人选了 DataBase 这门课

原文地址:https://www.cnblogs.com/zhaoxinhui/p/12300376.html