spark RDD 中Action的count、top、reduce、fold、aggregate (视频笔记)

count
返回整个RDD所有元素的个数

top
返回最大key的top个数元素。
会进行倒叙排序
返回的为数组

reduce
针对每个分区进行reduceLeft操作。
前两个进行reduce操作,然后结果与第三个元素操作。。。。。。。
然后对所有分区的结果进行reduceLeft操作
串行处理

aggregate
也是reduceLeft操作
是并行化的

原文地址:https://www.cnblogs.com/isenhome/p/5085579.html