运行Mahout示例的错误



我下载了"Mahout in Action"第09章的最新版本示例。我可以成功地运行几个示例,但是对于三个文件:newskmeanscluster .java、reuterstosparsevtors .java和newsfuzzykmeanscluster .java。运行这三个程序会得到类似的错误信息:

Aug 3, 2011 2:03:54 PM org.apache.hadoop.metrics.jvm.JvmMetrics initINFO:初始化JVM Metrics与processName=JobTracker, sessionId=

Aug 3, 2011 2:03:54 PM org.apache.hadoop.mapred.JobClient configureCommandLineOptions警告:使用GenericOptionsParser解析参数。应用程序应该

Aug 3, 2011 2:03:54 PM org.apache.hadoop.mapred.JobClient configureCommandLineOptions警告:未设置作业jar文件。可能找不到用户类。参见JobConf(Class)或JobConf # setJar(字符串)。

线程"main"异常org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:file:/home/user1/workspaceMahout1/recommended/inputDir

org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus (FileInputFormat.java: 224)

org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat.listStatus (SequenceFileInputFormat.java: 55)

org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits (FileInputFormat.java: 241)

org.apache.hadoop.mapred.JobClient.writeNewSplits (JobClient.java: 885)org.apache.hadoop.mapred.JobClient.submitJobInternal (JobClient.java: 779)org.apache.hadoop.mapreduce.Job.submit (Job.java: 432)org.apache.hadoop.mapreduce.Job.waitForCompletion (Job.java: 447)

org.apache.mahout.vectorizer.DocumentProcessor.tokenizeDocuments (DocumentProcessor.java: 93)在mia.clustering.ch09.NewsKMeansClustering.main (NewsKMeansClustering.java: 54)

对于上面的消息,我不太明白这两个警告是什么意思?此外,看起来应该已经创建了"输入路径",我如何创建这种类型的输入?谢谢。

可以忽略警告。错误是您指定的输入目录不存在。它存在吗?你的命令行是什么?

我遇到了类似的不匹配。在https://github.com/tdunning/MiA上的MiA文件在某些情况下,.csv文件与Java源代码保留在相同的目录中。例如https://github.com/tdunning/MiA/tree/master/src/main/java/mia/recommender/ch02…然而,通过Eclipse,加载它使用DataModel model = new FileDataModel(new File(" import .csv"));…没有找到。

添加

System.out.println("CWD: "+System.getProperty("user.dir"));

…将显示Eclipse正在查找的位置(在我的示例中,是文件树的几个级别,但这可能取决于您设置的具体方式)。

最新更新