使用OCR从PDF提取尺寸



我正在寻找一种方法来编程检查PDF CAD图,普通2D打印,并拔出所有尺寸以及页面上尺寸的位置。我正在寻找可以这样做的技术。

我正在研究LeadTools,PDFBox,Itext,Tet,Adobe SDK,并尝试在其中进行一些比较。我对准确识别尺寸/数字和形状特别感兴趣,并且API也必须具有提取位置信息的能力。任何过去的任何经验或对好的经验/坏洞察力都将不胜感激!

我们可以提供有关您问题的铅托部分的相关信息,因为它是我们的产品。

如果PDF包含实际文本,而不仅仅是文本的图像,则可以直接提取它而无需浏览OCR。为此,请使用LeadTools.pdf.pdfdocument.parsepages()方法。

如果您正在处理包含文本和非文本区域的图像,则可以使用leadtools.imageprocessing.core.autozoningcommand来隔离文本区域(区域)并获得其坐标。然后,您可以使用我们的OCR引擎或您自己的代码。如果您尝试此操作并且不会获得令人满意的结果,则可能还有其他高级选项可以帮助您,但是我们可能需要查看您正在使用的实际样本。如果您愿意,请将某些示例文件发送到我们的支持地址,并提及到目前为止尝试的内容。

最新更新