隐藏的三维卷积网络层的形状,如何计算?



我想计算机CNN的给定隐藏层输出的形状,所以假设输入形状是(27,27,27,1(即一个图像channe,第一个卷积层是一个16X(3,3,3(核,步幅是1,填充是0,所以这个层的输出形状是:(25,25,25,16(,16对应这一层中的内核数, 所以这里有 16 卷形状 (25,25,25( 之后,我们有第二个 32X(3,3,3( 核的卷积层,步幅为 1,填充为 0,因此该层中的每个内核都应(通常(应用于该层的整个输入体积,即 (25,25,25,16(,但这里的输出是形状 (23,23,23,32(, 如果我基于 conv2d,我的理解是每个内核都应用于输入中的整个卷,并且我们将所有内核的结果堆叠在一起,以便在相关层的输出中具有深卷。 所以我不明白我们是如何得到这个的(23,23,23,32(,第一层输出的第四维(即 16(去了哪里?

只考虑第二层(忽略偏差(

输入形状:(25、25
  • 、25、16(
  • 内核大小: (3, 3, 3(
  • 输出通道:32
  • 总重量数:16*32*3*3*3

与 2D 卷积层真正执行多个 3D 卷积的方式类似,3D 卷积层实际上执行多个 4D 卷积。具体来说,所讨论的 3D conv 层正在执行 32 个卷积,每个卷积都有一个大小为 (3、3、3、16( 的内核。对输入特征进行这些卷积运算的结果之一是 (23, 23, 23, 1(。完成所有 32 个操作后,它们沿通道维度堆叠,最终输出形状为 (23, 23, 23, 32(。

最新更新