感知哈希的准确性/精确度

我想在一卡车照片中找到相同且非常相似的图像。为此，我想比较他们感知散列的Levenstein(或Hamming，尚未决定(距离。为了计算这些，我想使用imghash(也不是最终决定(。对于输出，imghash允许选择输出格式和位数。我认为改变位数会改变精度，但它真的会改变吗？默认情况下，输出为16个字符的十六进制字符串(十八进制四百四十六进制..组合(。看起来有些过头了。但是是吗？如果是，合理的长度是多少？

当使用imghash和hamming距离来计算图像的相似性时，它是这样的：

imgHash接受[,bits]作为可选参数，默认情况下为8。更长的哈希值确实意味着更高的准确性：对于我测试的"非常相似"的图像，它们的4位哈希值相同，但8位哈希值不同
最大hamming距离(当图像完全不同时-黑色和白色画布(等于哈希长度^2。因此，您需要调整所选的图像相似性阈值

还有：

所选的位长度必须可被4整除
当比较感知散列时，这些散列需要具有相同的长度

相关内容

最新更新

热门标签：