我目前正在处理数字手写识别问题。我发现许多最先进的算法对mnist日期集采用了一些预处理方法,比如去中心化和抖动(我不知道什么是"抖动")。我在谷歌上搜索了很长一段时间,但没有找到可以用来取消mnist日期集偏移的具体方法或算法。有人对如何解决这个问题有想法吗?非常感谢!
我在谷歌上搜索了很长时间,也很难找到这个,但直到我看到这篇论文:
Teow、Loo Nin和Kia Fock Loe。"强大的基于视觉的功能和离线手写数字识别的分类方案。"模式识别35.11(2002):2355-2364。
阅读第4.2节。他们描述了去除图像的程序。我不确定这是否与桌面编辑相同,但这是我能找到的最接近的东西。
希望能得到帮助,如果有人能确认去毛刺是否与桌面清理相同,我们将不胜感激。
Deskewing摘自LeCun 1998年的论文[http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf]。
去斜计算像素的第二惯性矩(将前景像素计数为1,将背景像素计数为0)并通过水平移动线条来剪切图像主轴是垂直的。