Tesseract适用于仅包含文本的图像-裁剪图像以仅从图像中获取文本部分

Tesseract适用于仅包含文本的图像。但是，如果有文本和图像，而我们只想得到要识别的文本，该怎么办。

我正在使用Tesseract对图像中的文本进行OCR识别。Tesseract是从只有文本的图像中给出精确的文本。然而，当我检查包含汽车及其汽车号码的图像时，Tesseract为汽车号码提供了不同的乱码文本。我应用了灰度优化、阈值和其他效果来获得准确的文本输出，并提高了输出的准确性，但它仍然给出了混合了不同编码的不同文本。同样，我正在寻找其他方法来提取这样的文本。

有人知道如何使用Tesseract OCR或任何替代方法从这些图像中获取文本吗？这样，图像中只保留文本部分，以便Tessefact可以在输出中给出准确的文本。

裁剪图像是获得唯一文本的一种选择，但如何使用ImageMagick或任何其他选项来做到这一点。

谢谢。

如果您确切地知道文本在图像上的位置，您可以将这些区域的坐标与图像一起发送给Tesseract进行识别。查看Tesseract API方法TesseractRect或SetRectangle。

相关内容

最新更新

热门标签：