我在Mac上使用的是最新版本的Tesseract。我在一个文件夹里有一个eng.traineddata,在另一个文件夹中有一个eng.trainedata。我希望将我的训练数据文件合并为一个大的训练字体文件。
有人能告诉我怎么做吗?我在某个地方读到,-l命令可能正是我所需要的。
谢谢!
Tesseract不在两个不同的文件夹中查找语言数据。您可以将其中一个重命名为eng1.traineddata
,然后将它们指定为tesseract
命令的-l eng+eng1
选项。
我也尝试过,但似乎只有当我们通过同时编译多个图像来创建traineddata文件时,这才是可能的。这是详细的程序。。。。
"https://printalert.wordpress.com/2014/10/28/tesseract-training-more-fonts/"