我最近读了一些关于神经网络的期刊和pdf。我把注意力集中在一篇关于"使用神经网络的手写识别"的文章上。此外,我正在学习反向传播。我的问题是"为什么作者建议读者使用Sobel算子作为预处理技术,而不是直接将手写处理到神经网络?"
笔迹是由笔画组成的,通常笔画是用纯色填充的:在这些假设下,笔画的边缘很好地描述了笔画,而笔画的颜色或背景色在描述笔画时就不那么有用了。边缘基本上由布尔值描述:当像素是边缘的一部分时为白色,否则为黑色。
索贝尔滤波器输出图像的灰度与边缘的强度成正比,因此它可以用来描述边缘,然后描述笔画,或者,"捕捉"手写字母和数字的本质。
如果你给网络提供手写字母或数字的原始图像,那么网络就有可能学习到一些不太有用的特征,比如不能很好地描述字母或数字的完整灰度等级。
一些作者声称索贝尔滤波器以亮度不变的方式给出边缘,尽管我认为这不是严格正确的。
出于好奇,作者建议读者使用索贝尔过滤器的论文是什么?