如何区分图像上的 2 类:数字和"other letters and noise"?



我开发了一种图像识别算法,有助于从现实世界中找到脏面板上的字符。实际上,图像是一个包含字母,数字和泥浆的汽车牌照。

该算法必须将字符分为两类:字母字符和数字。是否可以训练LBP或Haar级联来区分两个类,由于数字形状的多样性,训练结果会稳定吗?

您能简要解释一下或推荐更好的方法吗?

"算法必须将字符分为两类:字母字符和数字。 - 你忘记了泥浆和背景,尽管从技术上讲,你可以将它们添加到一个广泛的类别"其他"。Haars 级联用于人脸检测之类的东西,因为它们通常在中空间尺度上近似小波,其中人脸具有特征特征。你的问题是不同的。你需要首先了解你的问题结构,阅读文献,然后才尝试使用纯粹的学习算法。这本书实际上谈到了人们开始首先思考方法,而不是分析问题,这并不总是一个好主意。

从技术上讲,您首先需要在图像中找到文本,鉴于当前最先进的OCR,通常用作库而不是从头开始创建,这可能比识别它更具挑战性。为了在图像中查找文本,我建议首先进行自适应阈值以创建二进制映射(1-前景是字母和数字,0是背景),然后在前景上执行连接组件,并结合SWT(笔画宽度变换)http://research.microsoft.com/pubs/149305/1509.pdf

最新更新