我有一些已知格式的文档的照片/扫描。每个文档都包含一些已知的属性(日期/时间、名称和项目列表(。
你能建议(在Objective(C/C++中(从哪些应用程序/库开始吗?OpenCV能做到这一点吗?OCR呢?OCR的布局识别?
谢谢!
附言:请建议如何重新表述我的帖子
附言:我发现了一些有前景的工具(例如iOS(:https://code.google.com/p/tesseract-ocr/和https://github.com/robmathews/OCR-iOS-Example
要检测文本在页面上的位置,我建议使用OpenCV进行检测,然后将文本区域发送到tesseract。
查找文本:
Erode图像
查找轮廓
获取轮廓的边界框
这些边界框应包含文本或徽标/图片。