我正在执行许多刮擦和摘要任务,并发现报纸非常适合我(大部分(我的需求。我有一系列PDF文件,我还需要查看并执行类似的任务。我可以找到其他可以打开和提取故事的应用程序,希望直接喂报纸,然后让它做它的事情。...但是,到目前为止,我一直无法弄清楚如何做到这一点。有任何建议吗?
这是一个很棒的软件包,可以处理您的困境:pymupdf,请参阅
https://pymupdf.readthedocs.io/en/latest/
然后运行:
import fitz
并关注文档。