[转]Mahout聚类算法Canopy+Kmeans测试实例

        Mahout是Apache的顶级开源项目,它由Lucene衍生而来,且基于Hadoop的,对处理大规模数据的机器学习的经典算法提供了高效的实现。其中,对经典的聚类算法即提供了单机实现,同时也提供了基于hadoop分布式的实现,都是非常好的学习资料。

        这里主要参考以下几篇文章,并且提供测试数据,有兴趣的可以实战以下。

1、http://my.oschina.net/BreathL/blog/58104

2、http://www.cnblogs.com/vivounicorn/archive/2011/09/23/2186483.html

3、http://www.cnblogs.com/vivounicorn/archive/2011/10/08/2201986.html

测试数据请到这个地方下载:http://download.csdn.net/detail/yuandianlws/4745470

作者:yuandianlws 发表于2012-11-8 11:19:19 原文链接
阅读:843 评论:0 查看评论
原文地址:https://www.cnblogs.com/yuandianliws/p/3568257.html