Tesseract适用于仅包含文本的图像-裁剪图像以仅从图像中获取文本部分



Tesseract适用于仅包含文本的图像。但是,如果有文本和图像,而我们只想得到要识别的文本,该怎么办。

我正在使用Tesseract对图像中的文本进行OCR识别。Tesseract是从只有文本的图像中给出精确的文本。然而,当我检查包含汽车及其汽车号码的图像时,Tesseract为汽车号码提供了不同的乱码文本。我应用了灰度优化、阈值和其他效果来获得准确的文本输出,并提高了输出的准确性,但它仍然给出了混合了不同编码的不同文本。同样,我正在寻找其他方法来提取这样的文本。

有人知道如何使用Tesseract OCR或任何替代方法从这些图像中获取文本吗?这样,图像中只保留文本部分,以便Tessefact可以在输出中给出准确的文本。

裁剪图像是获得唯一文本的一种选择,但如何使用ImageMagick或任何其他选项来做到这一点。

谢谢。

如果您确切地知道文本在图像上的位置,您可以将这些区域的坐标与图像一起发送给Tesseract进行识别。查看Tesseract API方法TesseractRectSetRectangle

最新更新