创建优化/适合OCR的相机活动



我正在尝试创建一个相机活动,用于将照片进行OCR处理。以下是我希望实现的目标:

  1. 相机预览中间的一个可调整大小的框,用于指示将哪个特定区域创建为位图并由OCR引擎处理
  2. 连续自动对焦(已完成)

我正在使用tesseract btw.

如果有人愿意给我指一些参考/例子/教程,那就太好了。

这里有一个取景器矩形:

https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

我一直在做类似的事情。现在,我只是将整张照片发送到一个Web服务,并使用OCRfeeder进行处理,OCRfeeer将对图像进行分割,并将其中包含文本的每个部分发送到tesseract。通过这种方式,我的准确率一直在提高。此外,您可能需要先执行一些预处理以清理图像。

可以有两种通用方法。

您可以在将图像发送到OCR引擎之前调整图像大小。请记住,您使用的Tesseract引擎有某种功能——它需要字符和图像边界之间的一些空间,有时比预期的要大。

第二种方法是使用字段级识别,当您指定文本块的坐标并将完整图像发送到OCR引擎时。看看http://www.ocrsdk.com,这是ABBYY最近推出的一个带有web api的云OCR SDK,它处于测试版,所以现在可以免费使用。它有一个领域级的识别方法和Android代码示例。我在ABBYY工作,如有必要,可以提供有关我们产品的其他信息。

最新更新