如何使用Opencv文档识别与OCR



我是计算机视觉的初学者,但我知道如何使用opencv上的一些函数。我试图使用Opencv文档识别,我想要一个帮助来找到它的步骤。

我想使用opencv的例子find_obj.cpp,但文件,例如护照,有一些变量,姓名,出生日期,照片。所以,我需要一个帮助来定义它的步骤,如果可能的话,我必须在这些步骤上使用函数。

我没有要求完整的代码,但如果有人有任何示例链接,或者你可以只是键入一个演练,这是很大的帮助。

这里涉及到两个非常不同的步骤。一个是检测你的对象,另一个是分析它。

对于物体检测,你只是试图找出物体是否在帧中,以及它的大致位置。OpenCv特性框架非常适合于此。有关一些教程和全面的示例代码,请参阅OpenCv features2d教程,特别是功能匹配教程。

对于分析,您需要深入研究光学字符识别(OCR)。OpenCv不包含OCR库,但我建议您查看tesseract-ocr,这是一个很棒的OCR库。如果您的文档有固定的结构(文本字段的一致布局),那么tesseract-ocr就是您所需要的。要了解更高级的分析,请查看ocropus,它使用tesseract-ocr,但添加了布局分析。

最新更新