使用PdfSharp从Pdf获取XMP元数据



我想从PDF文档中读取XMP元数据。我试着用PDFsharp读取数据(http://www.pdfsharp.net/)。大多数时候,它运行良好,但在某些情况下,我会遇到这个例外:

Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.

我在某个地方读到,在新版本中不会发生这种情况。所以我下载了PdfSharp 1.50.3638-beta(https://www.nuget.org/packages/PdfSharp/1.50.3638-beta)。

是的,现在我也不例外。但我的新问题是,函数PdfReader.open对某些文档不起作用。这意味着程序永远不会离开函数。

在一些论坛上,我读到它可能是由带有许多图像的大型文档引起的。所以我试着只阅读文件的信息:

PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);

但它仍然不起作用。我如何阅读元数据的一些想法?

对IRef流的支持是PDFsharp 1.50测试版的新功能,如果您有无法读取的文件,请将其提交检查。

最新更新