SIFT 向量的分层 k 均值聚类



All

我正在寻找在 http://www.wisdom.weizmann.ac.il/~bagon/CVspring07/files/scalable.pdf 中应用David Nister和Henrik Stewenius的相同方法

在本文中,他们使用大量 SIFT 向量 (128-D) 作为分层 k 均值聚类的输入,以构建分层视觉词汇树。

有没有人知道我可以用来进行此聚类分析的任何好库?

Ps:输入 SIFT 描述符的数量很高(70,000,000),我希望结果将是具有 1,000,000 个叶节点的词汇树。

非常感谢。问候。

如果

数据采用受支持的格式,OpenIMAJ 中的 ClusterQuantiser 工具应该能够执行此操作。如果该工具无法处理开箱即用的数据,则可以为 1.0.5 版本中的 org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeans 类(在 svn 主干版本中)或 org.openimaj.ml.clustering.kmeans.HByteKMeans 类编写驱动程序。该类的两个版本都支持从磁盘流式传输数据,因此您无需将所有功能保存在内存中!

为了完整起见,vlfeat 还有一个分层的 k 均值实现,但我不确定它的扩展程度。

根据实践经验,您还可以考虑在聚类之前对特征进行采样。我不确定您是否会从将它们全部聚类中获得很多好处。

相关内容

  • 没有找到相关文章

最新更新