使用扁平代码了解 pdf 结构

  • 本文关键字:了解 pdf 结构 代码 pdf
  • 更新时间 :
  • 英文 :


美好的一天!

我阅读了pdf上的文档,但我有一些全球性问题。

https://www.adobe.com/content/dam/acom/en/devnet/acrobat/pdfs/PDF32000_2008.pdf

我需要带有交叉引用流的 pdf 文件中的外部参照表。

这是 pdf 文件https://ufile.io/q77el

pdf文件的一部分:启动外部参照22827515%%EOF

这是这部分:

6628 0 obj
<<
/W [1 4 1]
/Info 1 0 R
/Root 2 0 R
/Size 6629
/Type /XRef
/Filter /FlateDecode
/Length 3996
/DecodeParms <<
/Columns 6
/Predictor 12
>>
>>
stream
  xÚí]{|ŽåŸç=ïÝf6­LNIŒ³ŒeHŽ;ÙæÜÁ!D¥ƒèWé...
endstream

我找到了这个文本,使用函数 gzucompression 并有这个

$a = gzuncompress(substr($match[2][0],1,-1));
0200 0000 0000 ff02 0200 0000 0301 02ff
0000 000c 0002 0000 000f 7e00 0201 0000
f176 0102 ff00 0000 c2ff 0201 0000 003e
0202 0000 0000 0001 0200 0000 0000 0102
0000 0000 0001 0200 0000 0000 0102 0000
0000 0001 0200 0000 0000 0102 ff00 000d
3bf8 0201 0000 f3c5 0902 0000 0000 0001
0200 0000 0000 0102 0000 0000 0001 0200
0000 0000 0102 0000 0000 0001 0200 0000
0000 0102 0000 0000 0001 0200 0000 0000

TXT 文件

但这意味着什么?我看到/W [1 4 1] 表示我需要将字符串分成 3 部分: 1 字节 4 字节 1 字节

02 00000000 00FF 02020000 0003 0102ff00 0000 0c000200 00

但这行不通。请告诉我下一步该怎么做。谢谢!

答案 - 预测变量信息。/第 6 列 - 表示 n+1 上的夹板/预测因子 12 - 表示这是 png 算法

最新更新