需要本地SDK工具来解析带有大表的原生pdf文件



用户需要在本地解析原生pdf(可选数据,不扫描,不需要OCR(。pdf文件可能有超过400页的大表格。某些表格可能没有清晰的边框。有什么API我可以使用吗?谢谢

既然我知道您不想要API,我可能建议您从nuget查看ItextSharp。我过去已经用过好几次了,有很多关于如何使用它的堆栈溢出论坛。https://www.nuget.org/packages/iTextSharp/5.5.13.1

编辑:我很抱歉,看起来iTextSharp已经被iText7取代了https://itextpdf.com/en/products/itext-7

似乎有几个PDF解析器API可以使用。PDFTron看起来很有前景,他们提供免费试用:https://www.pdftron.com/pdf-sdk/parsing-library/

DocParser也可能对您有所帮助,https://docparser.com/features.

我通过简单的谷歌搜索找到了所有这些,所以为自己做一些研究可能会对你有益。因为我们只能根据你问题中的信息提出广泛的建议。

最新更新