Mahout 0.9使用哪个Hadoop ?



我使用Mahout Cookbook,它展示了Mahout 0.8的示例,并使用Hadoop 0.23.5。

我是整个系统的新手,所以我想知道在运行Mahout 0.9时使用哪个Hadoop版本?

谢谢

从maven中提取Mahout 0.9时,它包含hadoop-core 1.2.1版本。据此,Mahout 0.9版本不能与hadoop 2一起工作。它在github上的最新主分支中得到解决,但这需要您从源代码重新编译mahout并包含hadoop 2库。Mahout 1.0应该支持hadoop 2。X版本。

如果您选择在Hadoop 2中运行Mahout 0.9,您可以按照以下步骤使其工作:

git clone https://github.com/apache/mahout.git

在Mahout文件夹中,键入:

mvn -Dhadoop2.version=2.2.0 -DskipTests clean install
mvn -Dhadoop2.version=2.2.0 clean package

下面是基于推荐条目的用法示例:

bin/mahout recommenditembased  --input input/input.txt --output output --usersFile input/users.txt --similarityClassname SIMILARITY_COOCCURRENCE

编辑:原始来源为http://mahout.apache.org/developers/buildingmahout.html

这个版本的Mahout也运行在hadoop 0.2 core jar中。我在windows机器上使用它,作为0.2起,hadoop为windows系统提供权限异常

相关内容

  • 没有找到相关文章

最新更新