在处理 tiff 文件的过程中,这些文件有 600 - 700 页来自带有 hocr 选项的 Tesseract OCR 引擎,我们监控文件大约需要 40 - 50 分钟。
我们监控到处理大文件的时间太多了。
我们有什么办法可以加快这一进程吗?
以下命令正在使用:-
<Drive>:Tesseract-OCR>tesseract.exe "Source_Tiff_File" "Destination_File" hocr
您可以拆分多页 TIFF 并在多个进程中运行它们。