用于32x32图像的ResNet



我正在尝试为32x32图像训练resnet,我遇到了一个教程:https://towardsdatascience.com/resnets-for-cifar-10-e63e900524e0,这适用于cifar-10(32x32图像数据集(,但我不明白它在说什么。

这是来自网站:

"作者构建ResNet的其余注释是:

  • 使用6层3x3卷积的堆栈。的选择将决定我们ResNet的规模。

  • 特征图大小分别为{32,16,8},每个特征图大小有2个卷积。此外,滤波器的数量分别为{16,32,64}。

  • 通过ResNet实现体积的下采样,将步幅增加到2,用于每层的第一次卷积。因此,直到在密集层之前才使用池化操作。

  • 对于旁路连接,将不使用突出部分。在体积形状不同的情况下,输入将简单地用零填充,因此输出大小与添加之前的体积大小匹配。

这将留下图4作为我们第一层的表示。在这种情况下,我们的旁路连接是一个常规的标识快捷方式,因为卷的维度在层操作中是恒定的。由于我们选择n=1,因此在层1内应用2个卷积。

我们仍然可以从图2中检查到,Layer1的输出音量确实是32x32x16。让我们更深入">

我很困惑为什么输出中的通道数量是16,而滤波器的数量是{16,32,64}

请注意,第1层的过滤器数量为16,第2层为32,第3层为64。

相关内容

  • 没有找到相关文章

最新更新