创建优化/适合OCR的相机活动

我正在尝试创建一个相机活动，用于将照片进行OCR处理。以下是我希望实现的目标：

相机预览中间的一个可调整大小的框，用于指示将哪个特定区域创建为位图并由OCR引擎处理
连续自动对焦（已完成）

我正在使用tesseract btw.

如果有人愿意给我指一些参考/例子/教程，那就太好了。

这里有一个取景器矩形：

https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

我一直在做类似的事情。现在，我只是将整张照片发送到一个Web服务，并使用OCRfeeder进行处理，OCRfeeer将对图像进行分割，并将其中包含文本的每个部分发送到tesseract。通过这种方式，我的准确率一直在提高。此外，您可能需要先执行一些预处理以清理图像。

可以有两种通用方法。

您可以在将图像发送到OCR引擎之前调整图像大小。请记住，您使用的Tesseract引擎有某种功能——它需要字符和图像边界之间的一些空间，有时比预期的要大。

第二种方法是使用字段级识别，当您指定文本块的坐标并将完整图像发送到OCR引擎时。看看http://www.ocrsdk.com，这是ABBYY最近推出的一个带有web api的云OCR SDK，它处于测试版，所以现在可以免费使用。它有一个领域级的识别方法和Android代码示例。我在ABBYY工作，如有必要，可以提供有关我们产品的其他信息。

相关内容

最新更新

热门标签：