Python 找到字符串的 CRC32



我试图获取字符串数据类型变量的crc32,但收到以下错误。

>>> message='hello world!'
>>> import binascii
>>> binascii.crc32(message)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: a bytes-like object is required, not 'str'

对于字符串值,可以使用binascii.crc32(b'hello world!')来完成,但我想知道如何为字符串数据类型变量执行此操作

当你计算某些数据的crc32时,你需要知道你正在散列的字节的确切值。一个字符串可以表示不同编码中的不同字节值,因此将字符串作为参数传递是不明确的。

使用

binascii.crc32(b'hello world!') 时,您将使用简单的 ascii 表作为转换将 char 数组转换为字节数组。

要转换任何字符串,您可以使用:

import binascii
text = 'hello'
binascii.crc32(text.encode('utf8'))

这可以使用 binascii.crc32zlib.crc32 来完成。这个答案通过记录两个模块并生成一个字符串输出来改进 Tomas 之前的答案,而不仅仅是一个整数。


# Define data
> text = "hello"
> data = text.encode()
> data
b'hello'
# Using binascii
> import binascii
> crc32 = binascii.crc32(data)
> crc32
907060870
> hex(crc32)
'0x3610a686'
> f'{crc32:#010x}'
'0x3610a686'
# Using zlib
> import zlib
> zlib.crc32(data)
907060870  # Works the same as binascii.crc32.

如果不希望字符串输出具有0x前缀:

> import base64
> crc32 = 907060870
> digest = crc32.to_bytes(4, 'big')
> digest
b'6x10xa6x86'
> base64.b16encode(digest).decode().lower()
'3610a686'