有没有办法使用 tesseract OCR 引擎加速提取,而 tiff 文件有 600-700 页



在处理 tiff 文件的过程中,这些文件有 600 - 700 页来自带有 hocr 选项的 Tesseract OCR 引擎,我们监控文件大约需要 40 - 50 分钟

我们监控到处理大文件的时间太多了。

我们有什么办法可以加快这一进程吗?

以下命令正在使用:-

<Drive>:Tesseract-OCR>tesseract.exe "Source_Tiff_File" "Destination_File" hocr

您可以拆分多页 TIFF 并在多个进程中运行它们。

最新更新