在最近邻搜索的产品量化中,当涉及到IV.A部分时,它说他们也将使用粗量化器(他们觉得这只是一个非常小的产品量化器,更小的w.r.t。 k
,质心的数量)。
我真的不明白为什么这有助于搜索过程,原因可能是我认为我不明白他们使用它的方式。请问有什么好吗?
如非穷举搜索部分所述,
使用产品量化器进行近似最近邻搜索 速度快,可显著降低 存储描述符。
然而,搜索是详尽无遗的。
粗略量化器用于非穷举搜索。它首先检索候选集,然后根据 PQ 在候选集中搜索最近邻。
因此IMO的性能在很大程度上取决于粗量化器的性能。如果候选集首先不包含一些真正的最近邻,我们也无法在随后的 PQ 步骤中获取它们。
而粗量化器是ANN的基本算法之一,它不必与PQ一起使用。