Tesseract的最新可用版本是5.x,但最新的tika仍然使用4.x。有可能在Tika升级tesseractOCR版本吗?
我们将1.x分支移植到2.x后,使其存活了一年让人们有时间迁移。1.x中的大多数更改都在最后6个月左右与安全有关。我们将不再支持1.x在2022年9月30日之后。
我已经打开了一张机票和PR,在我们的下一个2.x版本2.5.0中将tesseract升级到5.x。
https://issues.apache.org/jira/browse/TIKA-3860