我是Hadoop/Mahout的新手,我理解这些概念,但在将Mahout作业部署到已经设置好的计算机集群时遇到了问题。
我已经在一台计算机上使用了Mahout,但我应该怎么做才能将其构建并运行到一个已经形成的Hadoop集群?
我有一个安装了Hadoop0.20.2和Mahout 0.9的集群,其中包含Hadoop1.2.1。我应该复制哪些jar以便运行包含Mahout调用的代码,或者我应该做些什么来使它在Hadoop集群上工作?
任何建议/示例/教程都会很棒。
感谢
问题的重要链接
https://mahout.apache.org/users/clustering/k-means-commandline.html