隐藏的三维卷积网络层的形状，如何计算?

我想计算机CNN的给定隐藏层输出的形状，所以假设输入形状是(27,27,27,1(即一个图像channe，第一个卷积层是一个16X(3,3,3(核，步幅是1，填充是0，所以这个层的输出形状是：(25,25,25,16(，16对应这一层中的内核数，所以这里有 16 卷形状 (25,25,25( 之后，我们有第二个 32X(3,3,3( 核的卷积层，步幅为 1，填充为 0，因此该层中的每个内核都应(通常(应用于该层的整个输入体积，即 (25,25,25,16(，但这里的输出是形状 (23,23,23,32(，如果我基于 conv2d，我的理解是每个内核都应用于输入中的整个卷，并且我们将所有内核的结果堆叠在一起，以便在相关层的输出中具有深卷。所以我不明白我们是如何得到这个的(23,23,23,32(，第一层输出的第四维(即 16(去了哪里？

只考虑第二层(忽略偏差(

输入形状：(25、25

、25、16(
内核大小： (3， 3， 3(
输出通道：32
总重量数：16*32*3*3*3

与 2D 卷积层真正执行多个 3D 卷积的方式类似，3D 卷积层实际上执行多个 4D 卷积。具体来说，所讨论的 3D conv 层正在执行 32 个卷积，每个卷积都有一个大小为 (3、3、3、16( 的内核。对输入特征进行这些卷积运算的结果之一是 (23， 23， 23， 1(。完成所有 32 个操作后，它们沿通道维度堆叠，最终输出形状为 (23， 23， 23， 32(。

相关内容

最新更新

热门标签：