我将通过本教程向tesseract添加新字体,到目前为止,我已经为我的pdf创建了tiff文件。我正在尝试运行命令:tesseract eng.impact.exp0.tiff eng.impact.exp0 batch.nochop makebox
但是它只显示这个:
Tesseract开源OCR引擎v3.02
无法打开输入文件:eng.impact.exp0.tiff
我就是不明白为什么!
我运行以下命令来创建tiff文件:convert -density 300 -depth 4 eng.impact.exp0.pdf eng.impact.exp0.tif
编辑:嗯,将-depth选项改为8而不是4工作。
您的图像文件名中似乎有一个打字错误。应该是:
tesseract eng.impact.exp0.tif eng.impact.exp0 batch.nochop makebox
试试这个命令来重命名TIFF文件:
mv eng.impact.exp0.tif eng.impact.exp0.tiff
,然后运行tesseract:
tesseract eng.impact.exp0.tiff eng.impact.exp0 batch.nochop makebox
我有这个问题,并解决它。
您必须首先复制tesseract.exe旁边的图像文件,然后进入该目录,打开命令提示符并运行命令。只是这。
注意:在命令提示符中,您必须在tesseract的路径中,并且image file必须在此路径中