机器学习中的照片OCR算法

我最近参加了coursera上的机器学习课程，并以不错的成绩通过了该课程。在课程中，我使用了KNN、逻辑回归、NN等算法，其中一项任务是编写我能够完成的数字识别学习算法。本课程以照片OCR的案例研究结束，这真的让我很兴奋，但我发现很难将课程中教授的基本算法应用于这个巨大的问题。有人能给我推荐一些照片OCR的算法吗？

图像识别的问题是它对任何变化都非常敏感。他们认为，即使应用了某些图像操作（如倾斜、旋转等），人类大脑也能够从图像中提取某些特征，这将使我们能够识别给定的图像。

也就是说，据我所知，人工神经网络是使用最广泛的（加入一两个隐藏层通常也有帮助）。我听说过的另一种技术是Wisard（或Wizard），但我找不到任何关于它的信息。这种技术基本上是将图像分成几个部分，然后在将图像片段与你的知识库中的内容进行比较时，你可以获得相似性的百分比。

话虽如此，如果我和你一样，我会坚持使用神经网络和一个不错的图形操作库，如OpenCV（有各种包装器，包括Java和C#）。目的是尽可能多地消除不需要的信息。例如，在某些情况下，将图像缩小到灰度级或严格意义上的黑白像素会有所帮助。

相关内容

最新更新

热门标签：