我的项目是使用python,opencv和scikit-learn识别手写泰米尔字符。
输入文件:手写泰米尔语图像。
输出文件:文本文件中可识别的字符。
完成项目的基本步骤是什么?我知道三个步骤, 预处理、特征点提取和分类
但是,我不知道如何确切地进行这个项目?
如何进行预处理?
训练数据集图像存储在哪里?
如何在OpenCV中提取特征点?如何实现这一点?
请帮忙....
我正在从事手写阿拉伯字符识别和生成的同一项目,但到目前为止我没有使用 opencv。因为在opencv中,您必须在图像上放置过滤器并处理该图像,并且每次都会获得相同大小的处理图像。但是在阿拉伯语中,每个字符都有如此多的变化,opencv对此毫无用处。
对于您的问题,我也有一些建议和帮助材料。在开始之前,您必须对字符识别和您想要的一切进行大量研究。阅读亚历克斯·格雷夫斯的研究论文,他对字符识别和生成做了很多研究。它会对你有很大帮助。
我正在使用神经网络来实现此目的。最初,这有点难以理解,但是当您理解这一点时,您将获得想要的一切。Python也是很好的语言。我有很多材料可以学习神经网络以及如何在此基础上训练您的数据集。我也有一些有用的链接,我在下面与您分享:
亚历克斯·格雷夫斯的个人资料:http://www.cs.toronto.edu/~graves/
神经网络理解:http://nikhilbuduma.com/2014/12/29/deep-learning-in-a-nutshell/视频: https://www.youtube.com/watch?v=q0pm3BrIUFo
Python 中的神经网络代码:http://iamtrask.github.io/2015/07/12/basic-python-network/
希望对您有所帮助。
谢谢