卷积神经网络中的旋转等方差



我想知道CNN的基本架构是否具有旋转等方差性质?我只知道平移等方差,但不确定旋转。

根据我的搜索,可以通过旋转输入图像进行训练来实现旋转等方差。我真的需要这样做吗?旋转度有多大?例如,我有一个CNN,可以在横向模式下检测/读取文本。如果我将图像旋转 90 度/使其成为纵向图像,它会给出与原始图像相同的结果/执行相同的效果吗?

您仅在一定程度上具有比例和旋转不变性 - 确切程度可能取决于您的设置。之所以拥有它,是因为包含要素的池可能重叠。

你的建议当然是可能的。您可以随时修改训练数据,添加噪声、旋转、不同的尺度等来实现该目标。但是,您的模型仍然不是完全旋转不变的。也可以修改网络本身以"正确"完成任务。我敢肯定,你在研究过程中偶然发现了平铺的CNN(如果没有,你绝对应该阅读那篇论文)。他们使用TICA进行预训练,在此过程中找到不变的特征。

对于你旋转 90° 的最后一个问题:我建议自己测试一下。如果旋转发生的情况是已知的(例如在移动设备上),我个人会看看手动将图片旋转回 0°(在将其提供给网络之前)是否是给定约束的令人满意的解决方案。这是最简单的方法。

最新更新