小贝子编程

如何在Tesseract中设置配置变量以更好地识别代码?

本文关键字：更好识别代码变量配置 Tesseract 设置 tesseract
更新时间 : 2023-09-22
英文 : How do I set up configuration variables in Tesseract to better recognize code?

我想使用Tesseract来识别代码。在他们的网站上说，我可以通过将配置变量load_system_dawg和load_freq_dawg设置为false来禁用字典。

然而，我一直没能正确地做到这一点。

$ tesseract img.jpg output.txt --oem 0 -c load_system_dawg=0 load_freq_dawg=0
read_params_file: Can't open load_freq_dawg=0
Error: Tesseract (legacy) engine requested, but components are not present in /usr/share/tesseract-ocr/4.00/tessdata/eng.traineddata!!
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

有什么最好的处理方法吗?

首先，获取eng。使用遗留引擎或其他OCR引擎值(OEM)训练数据。

接下来，仔细阅读tesseract --help-extra的输出:

-c VAR=VALUE          Set value for config variables.
Multiple -c arguments are allowed.

如何在Tesseract中设置配置变量以更好地识别代码?

相关内容

最新更新

热门标签：