ELKI的输出指数



我正在使用ELKI对CSV文件中的数据进行聚类

我使用

-resulthandler ResultWriter
-out folder/

保存输出数据

但作为输出,我有一些奇怪的索引

ID=2138 0.1799 0.2761
ID=2137 0.1797 0.2778
ID=2136 0.1796 0.2787
ID=2109 0.1161 0.2072
ID=2007 0.1139 0.2047

ID超过2000,尽管我有不到100个训练样本

DBID是内部的;文档明确指出,您不应该对它们做太多假设,因为它们的实现可能会发生更改。它们被写入输出的唯一原因是,一些方法(如OPTICS(可能需要通过这个唯一的ID来交叉引用对象。

因为它们是唯一的标识符,所以它们通常是连续递增的。下次在MiniGUI中单击"运行"时,您将获得下一个n ID。。。很明显,你不止一次点击了run。

ELKI DBID文档中的"提示和技巧"可能会回答您的基本问题——如何使用将DBID映射到输入文件的行号。最好的方法是如果您想拥有对象标识符,请使用标识符列(并将其配置为外部标识符(自行分配对象标识符

有关更多信息,请参阅文档:https://elki-project.github.io/dev/dbids

最新更新