使用 PyPDF2 或 Pdfminer 从 pdf 中提取 URL、书签、标记和注释



我试图使用 pypdf2 或 pdfminer 从 pdf 中提取 pdf 网址、评论或 bookmarsk。我看不到/Annots 或 URI,即使 pdf 中存在 url 或 bookmarsk。

使用PyMuPDF,我能够从pdf中提取链接和书签。如何安装 PyMuPDF1. 点安装PyMuPDF有直接的方法可以从PDF中提取书签和超链接。请参阅以下链接中的文档。http://pymupdf.readthedocs.io/en/latest/tutorial/#inspecting-the-links-of-a-pagehttp://pymupdf.readthedocs.io/en/latest/tutorial/#working-with-outlines

如果有人知道如何从pdf中提取注释和标记,请告诉我?

最新更新