我正在使用Mahout 0.9。我运行了kmeans,它在我的HDFS中得到了一些结果,例如clusteredPoints,clusters-2-final等。我知道它们是序列文件,不容易阅读。 但是,在 Java 代码中,clusterDumper.printClusters(( 默认在控制台上打印聚类结果。所以我想知道是否有办法将其打印到文件中? 多谢。
您可以将 clusterDumper 结果存储到 String 变量,然后将其导出到文件中。
String results = clusterDumper.getClusterIdToPoints().toString();
try {
FileWriter file = new FileWriter("results.txt");
file.write(results);
file.close();
} catch (IOException e) {
e.printStackTrace();
}
不要忘记为FileWriter导入库
import java.io.FileWriter;
import java.io.IOException;