使用OCR从PDF提取尺寸

我正在寻找一种方法来编程检查PDF CAD图，普通2D打印，并拔出所有尺寸以及页面上尺寸的位置。我正在寻找可以这样做的技术。

我正在研究LeadTools，PDFBox，Itext，Tet，Adobe SDK，并尝试在其中进行一些比较。我对准确识别尺寸/数字和形状特别感兴趣，并且API也必须具有提取位置信息的能力。任何过去的任何经验或对好的经验/坏洞察力都将不胜感激！

我们可以提供有关您问题的铅托部分的相关信息，因为它是我们的产品。

如果PDF包含实际文本，而不仅仅是文本的图像，则可以直接提取它而无需浏览OCR。为此，请使用LeadTools.pdf.pdfdocument.parsepages（）方法。

如果您正在处理包含文本和非文本区域的图像，则可以使用leadtools.imageprocessing.core.autozoningcommand来隔离文本区域（区域）并获得其坐标。然后，您可以使用我们的OCR引擎或您自己的代码。如果您尝试此操作并且不会获得令人满意的结果，则可能还有其他高级选项可以帮助您，但是我们可能需要查看您正在使用的实际样本。如果您愿意，请将某些示例文件发送到我们的支持地址，并提及到目前为止尝试的内容。

相关内容

最新更新

热门标签：