我在Mahout中运行KMeans
聚类算法。我正在使用KMeansDriver.run
函数,因为我也在使用Hadoop。
我想知道final centroids
存储在哪个文件中。这是否与我们为初始集群提供的文件相同。
我还想问part-m
和生成的part-r
文件是什么意思?
它存储在质心最终下的质心文件夹中。部分-m是映射器的输出,即没有归约作业R部分为减速机输出