计算机视觉-为什么我必须使用索贝尔算子

我最近读了一些关于神经网络的期刊和pdf。我把注意力集中在一篇关于"使用神经网络的手写识别"的文章上。此外，我正在学习反向传播。我的问题是"为什么作者建议读者使用Sobel算子作为预处理技术，而不是直接将手写处理到神经网络?"

笔迹是由笔画组成的，通常笔画是用纯色填充的:在这些假设下，笔画的边缘很好地描述了笔画，而笔画的颜色或背景色在描述笔画时就不那么有用了。边缘基本上由布尔值描述:当像素是边缘的一部分时为白色，否则为黑色。

索贝尔滤波器输出图像的灰度与边缘的强度成正比，因此它可以用来描述边缘，然后描述笔画，或者，"捕捉"手写字母和数字的本质。

如果你给网络提供手写字母或数字的原始图像，那么网络就有可能学习到一些不太有用的特征，比如不能很好地描述字母或数字的完整灰度等级。

一些作者声称索贝尔滤波器以亮度不变的方式给出边缘，尽管我认为这不是严格正确的。

出于好奇，作者建议读者使用索贝尔过滤器的论文是什么?

相关内容