CBIR的视觉词袋(从功能中获得).步骤?



我对将BOVW用于CBIR的步骤感到非常困惑。我找到了很多关于分类、机器学习和 SVM 的文献,但这并不是我想要的。
我的问题与使用图像查询在数据库中搜索图像相似性有关。

我到现在为止的步骤:

  1. 提取特征(例如:ORB、BRISK、SIFT 等)。
  2. 将所有图像的功能存储到磁盘。
  3. 读取特征并计算 K 均值以获得质心(我的词汇表,对吧?

现在我被困住了。我找到了许多不同的方法。

这是我的假设:

  1. 对于每个 k 均值计算最近邻 (FLANN?)
  2. 使用最近邻集构建直方图

我是否还必须为每个图像提取字典,然后为图像编制索引?
为什么需要矢量量化(步骤4.和5.)?

您能否向我建议一种可能的方法,或任何有关该主题的文章,教程?

注意:对于BOVW的实现,我无法使用OpenCV,因为它不适用于二进制描述符,因此我需要尝试使用sklearn库。

好的,这几乎是我想要的:

https://stackoverflow.com/a/8549874/8894489

希望这对某人有所帮助。

相关内容

  • 没有找到相关文章

最新更新