zlib错误码-3,而使用zlib解压PDF Flatedecode流



我正试图从PDF文件中提取一些信息。有一个12个字符的流是用Flatedecode压缩的,我一直无法解压缩,尽管文档中的其他流很容易用相同的python 3.9程序解压缩。

摘自美国政府- FAA仪器程序表)PDF文档,该文档在adobeacrobat中打开没有问题。

由iText作者编写的用于调查pdf的优秀RUPS程序似乎也难以解码该流,因为它只显示了12字节流中的一个字符。

import zlib
hexDigits = "78 9c e3 2a e4 e5 02 20 01 a3 20 93"
stripWhitespace = hexDigits.replace(" ", "")
myByteArray = bytearray.fromhex(stripWhitespace)
data = zlib.decompress(myByteArray) # Here I get Error -3 while decompressing data: incorrect data check
print(data)

您可能正在错误地提取或解码平面数据。在应该是零的地方似乎出现了空格。如果我将两个20都更改为00,则zlib流有效。

最新更新