感知哈希的准确性/精确度



我想在一卡车照片中找到相同且非常相似的图像。为此,我想比较他们感知散列的Levenstein(或Hamming,尚未决定(距离。为了计算这些,我想使用imghash(也不是最终决定(。对于输出,imghash允许选择输出格式和位数。我认为改变位数会改变精度,但它真的会改变吗?默认情况下,输出为16个字符的十六进制字符串(十八进制四百四十六进制..组合(。看起来有些过头了。但是是吗?如果是,合理的长度是多少?

当使用imghash和hamming距离来计算图像的相似性时,它是这样的:

  • imgHash接受[,bits]作为可选参数,默认情况下为8。更长的哈希值确实意味着更高的准确性:对于我测试的"非常相似"的图像,它们的4位哈希值相同,但8位哈希值不同
  • 最大hamming距离(当图像完全不同时-黑色和白色画布(等于哈希长度^2。因此,您需要调整所选的图像相似性阈值

还有:

  • 所选的位长度必须可被4整除
  • 当比较感知散列时,这些散列需要具有相同的长度

最新更新