我正在构建一个帮助查找重复图像的工具。要使用 bktrees,我需要使用位哈希,但是,最好将较大的位哈希压缩为较小的十六进制哈希以进行存储。
位哈希如下所示:dhash_bits = 19965419413067491224447942902196404479
位哈希的十六进制哈希如下所示:dhash_hex = 0f05332d4d0b471500007722dc7300ff
我尝试使用bin(int(dhash_hex,16))
将十六进制哈希转换回位,但我知道这不是正确的方法。
将十六进制哈希转换回位哈希的正确方法是什么?
以下是将位转换为十六进制的函数:
def format_hex(row_hash, col_hash, size=8):
hex_length = size * size // 4
return '{0:0{2}x}{1:0{2}x}'.format(row_hash, col_hash, hex_length)
您的dhash_bits
只是一个整数;相应的dhash_hex
值也可以通过以下方式实现
dhash_hex = format(dhash_bits, '032x')
大概您使用了dhash_int()
函数来获取它。
然后,反向操作是将十六进制转换回整数:
dhash_bits = int(dhash_hex, 16)
您的format_hex()
函数将行和列哈希的两个数字组合成一个字符串;您将通过对每一半应用int()
来再次获得两个单独的数字:
row_hash = int(dhash_hex[:len(dhash_hex) // 2], 16)
col_hash = int(dhash_hex[len(dhash_hex) // 2:], 16)