我下载了"Mahout in Action"第09章的最新版本示例。我可以成功地运行几个示例,但是对于三个文件:newskmeanscluster .java、reuterstosparsevtors .java和newsfuzzykmeanscluster .java。运行这三个程序会得到类似的错误信息:
Aug 3, 2011 2:03:54 PM org.apache.hadoop.metrics.jvm.JvmMetrics initINFO:初始化JVM Metrics与processName=JobTracker, sessionId=
Aug 3, 2011 2:03:54 PM org.apache.hadoop.mapred.JobClient configureCommandLineOptions警告:使用GenericOptionsParser解析参数。应用程序应该
Aug 3, 2011 2:03:54 PM org.apache.hadoop.mapred.JobClient configureCommandLineOptions警告:未设置作业jar文件。可能找不到用户类。参见JobConf(Class)或JobConf # setJar(字符串)。
线程"main"异常org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:file:/home/user1/workspaceMahout1/recommended/inputDir
org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus (FileInputFormat.java: 224)
org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat.listStatus (SequenceFileInputFormat.java: 55)
org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits (FileInputFormat.java: 241)
org.apache.hadoop.mapred.JobClient.writeNewSplits (JobClient.java: 885)org.apache.hadoop.mapred.JobClient.submitJobInternal (JobClient.java: 779)org.apache.hadoop.mapreduce.Job.submit (Job.java: 432)org.apache.hadoop.mapreduce.Job.waitForCompletion (Job.java: 447)
org.apache.mahout.vectorizer.DocumentProcessor.tokenizeDocuments (DocumentProcessor.java: 93)在mia.clustering.ch09.NewsKMeansClustering.main (NewsKMeansClustering.java: 54)
对于上面的消息,我不太明白这两个警告是什么意思?此外,看起来应该已经创建了"输入路径",我如何创建这种类型的输入?谢谢。
可以忽略警告。错误是您指定的输入目录不存在。它存在吗?你的命令行是什么?
我遇到了类似的不匹配。在https://github.com/tdunning/MiA上的MiA文件在某些情况下,.csv文件与Java源代码保留在相同的目录中。例如https://github.com/tdunning/MiA/tree/master/src/main/java/mia/recommender/ch02…然而,通过Eclipse,加载它使用DataModel model = new FileDataModel(new File(" import .csv"));…没有找到。
添加System.out.println("CWD: "+System.getProperty("user.dir"));
…将显示Eclipse正在查找的位置(在我的示例中,是文件树的几个级别,但这可能取决于您设置的具体方式)。