使用 pdfbox 的 pdf 版本信息不正确



我们有一个pdf,当在Acrobat Reader中打开时,它显示1.5的版本,但是当使用Pdfbox(版本1.8.3)时,版本显示1.3。

我们使用的代码:

`aDocument.getDocument().getVersion()`

其中 aDocument 是 PDDocument 的实例。我们使用的 Pdfbox 版本是 1.8.3

任何有关这方面的帮助将不胜感激。

Hitesh Saliya在他的问题Adobe中已经讨论了该PDF,在属性中显示不正确的PDF版本(PDF)。在这个答案中,似乎

  • 如果只考虑版本标题,则版本 1.3 是正确的(文档中没有要考虑的版本目录条目);
  • 如果还考虑到使用了对象流、交叉引用流、图层和透明度,则至少 1.5 版是正确的。

因此,在某种程度上,PDFBox和Adobe Reader都是正确的。

因此,首先必须决定他们认为PDF文档的版本是什么。

  • 是PDF文件声称的版本吗?

    作为特例,声称不同版本的 PDF 怎么办? 例如,标题和目录中的不同条目,或不同增量更新中的不同条目。

  • 是所选指标程序(例如固定版本中的 Adobe Reader)为 PDF 识别的版本吗?

  • 根据PDF的相应参考/规范,它是最小/最大的版本吗?

    甚至该范围内的任何版本都可以是正确答案(不是导致版本而是文档的版本)?

  • 上述内容的某种混合,例如要求保护的版本的最高版本和PDF有效的最低版本?

不过,说真的,人们很难期望在通用PDF库中实现选项1以外的任何东西。

最新更新