OCR为数不多的已知表单格式.从哪里开始



我有一些已知格式的文档的照片/扫描。每个文档都包含一些已知的属性(日期/时间、名称和项目列表(。

你能建议(在Objective(C/C++中(从哪些应用程序/库开始吗?OpenCV能做到这一点吗?OCR呢?OCR的布局识别?

谢谢!

附言:请建议如何重新表述我的帖子

附言:我发现了一些有前景的工具(例如iOS(:https://code.google.com/p/tesseract-ocr/和https://github.com/robmathews/OCR-iOS-Example

要检测文本在页面上的位置,我建议使用OpenCV进行检测,然后将文本区域发送到tesseract。

查找文本:

Erode图像

查找轮廓

获取轮廓的边界框

这些边界框应包含文本或徽标/图片。

相关内容

  • 没有找到相关文章

最新更新