机器学习中的照片OCR算法



我最近参加了coursera上的机器学习课程,并以不错的成绩通过了该课程。在课程中,我使用了KNN、逻辑回归、NN等算法,其中一项任务是编写我能够完成的数字识别学习算法。本课程以照片OCR的案例研究结束,这真的让我很兴奋,但我发现很难将课程中教授的基本算法应用于这个巨大的问题。有人能给我推荐一些照片OCR的算法吗?

图像识别的问题是它对任何变化都非常敏感。他们认为,即使应用了某些图像操作(如倾斜、旋转等),人类大脑也能够从图像中提取某些特征,这将使我们能够识别给定的图像。

也就是说,据我所知,人工神经网络是使用最广泛的(加入一两个隐藏层通常也有帮助)。我听说过的另一种技术是Wisard(或Wizard),但我找不到任何关于它的信息。这种技术基本上是将图像分成几个部分,然后在将图像片段与你的知识库中的内容进行比较时,你可以获得相似性的百分比。

话虽如此,如果我和你一样,我会坚持使用神经网络和一个不错的图形操作库,如OpenCV(有各种包装器,包括Java和C#)。目的是尽可能多地消除不需要的信息。例如,在某些情况下,将图像缩小到灰度级或严格意义上的黑白像素会有所帮助。

最新更新