如何区分图像上的 2 类：数字和"other letters and noise"？

我开发了一种图像识别算法，有助于从现实世界中找到脏面板上的字符。实际上，图像是一个包含字母，数字和泥浆的汽车牌照。

该算法必须将字符分为两类：字母字符和数字。是否可以训练LBP或Haar级联来区分两个类，由于数字形状的多样性，训练结果会稳定吗？

您能简要解释一下或推荐更好的方法吗？

"算法必须将字符分为两类：字母字符和数字。 - 你忘记了泥浆和背景，尽管从技术上讲，你可以将它们添加到一个广泛的类别"其他"。Haars 级联用于人脸检测之类的东西，因为它们通常在中空间尺度上近似小波，其中人脸具有特征特征。你的问题是不同的。你需要首先了解你的问题结构，阅读文献，然后才尝试使用纯粹的学习算法。这本书实际上谈到了人们开始首先思考方法，而不是分析问题，这并不总是一个好主意。

从技术上讲，您首先需要在图像中找到文本，鉴于当前最先进的OCR，通常用作库而不是从头开始创建，这可能比识别它更具挑战性。为了在图像中查找文本，我建议首先进行自适应阈值以创建二进制映射（1-前景是字母和数字，0是背景），然后在前景上执行连接组件，并结合SWT（笔画宽度变换）http://research.microsoft.com/pubs/149305/1509.pdf

相关内容

最新更新

热门标签：