空间不变的矢量量化



我正在尝试实现Jason Hipp等人的算法。还有一个演示,它更短、更全面。

他们的方法简介:

他们使用矢量量化作为在任何给定图像中区分前景和背景的工具。但是,它们不是使用正方形区域作为特征向量来生成码字,而是使用圆形。这被认为是为了降低计算复杂度。以圆为谓词向量,将匹配问题简化为线性模式匹配任务,并允许空间不变的匹配。因此,该方法被称为空间不变矢量量化

因此,基本上,一个谓词向量是交互式选择的,然后在图像空间中查询该谓词向量与当前位置的相关性。

我的问题是:

  • 在整个算法中,他们在哪里生成代码本?如何?

  • 我看不出如何为要生成的代码本选择参数。如果他们首先对图像中所有可能位置的所有可能圆进行采样,这在计算上是非常繁重的。他们如何确定要生成的簇/码字的数量?

  • 为什么我会使子环相互摆动?

现在我的实现基本上包括一个半径为一的圆作为谓词向量。它遍历原生图像空间,并在所有可能的旋转中将谓词向量与当前像素周围的圆相关联。这是一个非常缓慢的过程,我看不出他们的算法有什么好处。我还没有实现任何接近矢量量化的东西,因为我看不出这将如何工作。

任何暗示或想法都值得赞赏。不幸的是,该方法的作者没有回答我的问题。

您的前两个问题不是该算法的特定问题,而是任何矢量量化算法的特定。这里有一个网页,用相对容易理解的术语描述了如何进行矢量量化,包括生成码本:http://www.data-compression.com/vq.html.

关于Wobble:在该算法中,关键的观察结果是,通过将曲面矢量化为环,曲面将不会被镶嵌(完全覆盖)。例如,如果使用正方形,它们会镶嵌曲面(完全覆盖曲面)。重叠的环不一定完全覆盖图像。由于这个原因,"在"环之间的像素可能会被遗漏,并导致匹配失败。为了弥补这一点,作者来回"摆动"圆环,最终覆盖了所有像素。

相关内容

  • 没有找到相关文章

最新更新