超越MapReduce的并行大数据处理

9.1:基于迭代处理平台的并行算法

不动点:

核心观点:

迭代例析:

1.PageRank(网络连接分析)

mapreduce中的实现:

存在的问题:

2.传递闭包

存在的问题:

3.K-means算法

存在的问题:

解决方法:缓存迭代

Reducer输入缓存:

Reducer的输出缓存:

Mapper的输入缓存:

体系结构:

9.2基于图处理平台的并行算法

pregel和mapreduce的不同之处:

系统的安装:

例子:计算子图同构

方法概述:

1.查询分解:

2.搜索:

3.join:

原文地址:https://www.cnblogs.com/cellphone7/p/10134543.html