我们有一些PDF/A文件要提取,当我们尝试使用标准的PDF提取库时,整个页面的程序不会返回任何内容。对于标准pdf和重新调整值,同样的程序运行得非常好。
有人能帮助如何使用python库转换它们吗。
您尝试过pyPDF2吗?
import PyPDF2
pdfFileObj = open('example.pdf', 'rb')