局部敏感的哈希 - 当水桶为空时会发生什么



假设我已经根据一组哈希构建了一个LSH数据库,我现在开始查询数据库以查找大约最近的邻居。

在计算查询点的哈希时会发生什么指导,而相应的存储桶为空?同样,说我想找到5个最近的邻居,并且水桶只有4个其他数据点?

我相信获得得太少而无法检索,这意味着您的培训数据存储桶太多。当然,这是申请依赖的。查看Greg Shakhnarovich实现的LSH Toolbox和他的README文件。在此实现中,较少的哈希功能(较小的k)表示更饱满的桶,而这又意味着较慢的lsh。

最新更新