Mahout初体验

Mahout运行版本:

  • mahout-0.5, mahout-0.6, mahout-0.7,是基于hadoop-0.20.2x的。
  • mahout-0.8, mahout-0.9,是基于hadoop-1.1.x的。
  • mahout-0.7,有一次重大升级,去掉了多个算法的单机内存运行,并且了部分API不向前兼容。

注:“用Maven构建Mahout的开发环境”,文中的 2个例子都是基于单机的内存实现,因此选择0.6版本。Mahout在Hadoop集群中运行会在下一篇文章介绍。

 

1. 安装Mahout
 
    svn co http://svn.apache.org/repos/asf/mahout/trunk mahout 将mahout从代码库中下载下来,此处下载的是主干代码。在mahout
 
目录执行mvn install 安装,如果想快一点就跳过单元测试检验的那些个环节,使用mvn clean install -DskipTests=true。

注意:如果你当前是在windows下进行编译,一定要确保正确安装了Cygwin+hadoop。这里用几个比较好的教材,讲解如何在windows下安装Hadoop Clusterhttp://ebiquity.umbc.edu/Tutorials/Hadoop/00%20-%20Intro.htmlhttp://hayesdavis.net/2008/06/14/running-hadoop-on-windows/ (不懂的多看看吧,本人)
 
如果过程中没有报错的话说明安装成功。

这个命令会运行默认设置,它会构建core  examples下的源码,并且会把它们打包起来。
2.编译、安装core

1).       跳转到core的文件夹

2).       Mvn compile

3).       Mvn install

3.编译 examples

在编译examples 下的源码前,请要先install core文件夹下的源码

1).       跳转到 examples 文件夹

2).       Mvn compile

原文地址:https://www.cnblogs.com/DjangoBlog/p/3592312.html