我使用Mahout Cookbook,它展示了Mahout 0.8的示例,并使用Hadoop 0.23.5。
我是整个系统的新手,所以我想知道在运行Mahout 0.9时使用哪个Hadoop版本?
谢谢
从maven中提取Mahout 0.9时,它包含hadoop-core 1.2.1版本。据此,Mahout 0.9版本不能与hadoop 2一起工作。它在github上的最新主分支中得到解决,但这需要您从源代码重新编译mahout并包含hadoop 2库。Mahout 1.0应该支持hadoop 2。X版本。
如果您选择在Hadoop 2中运行Mahout 0.9,您可以按照以下步骤使其工作:
git clone https://github.com/apache/mahout.git
在Mahout文件夹中,键入:
mvn -Dhadoop2.version=2.2.0 -DskipTests clean install
mvn -Dhadoop2.version=2.2.0 clean package
下面是基于推荐条目的用法示例:
bin/mahout recommenditembased --input input/input.txt --output output --usersFile input/users.txt --similarityClassname SIMILARITY_COOCCURRENCE
编辑:原始来源为http://mahout.apache.org/developers/buildingmahout.html
这个版本的Mahout也运行在hadoop 0.2 core jar中。我在windows机器上使用它,作为0.2起,hadoop为windows系统提供权限异常