conv3d的Tensorflow输入形状

我有(x,y)高度和宽度的视频，我将视频大小调整为高度320和宽度120，使用3通道RGB。现在我从视频中合并60帧，并从10200帧中创建了60的深度。现在我不确定用conv3d训练模型，我的输入形状(170,60,320,120,3)是否正确。对于tensorflow中的input_shape，这个格式(batch, depth, height, width, channel)是否正确?

根据最新版本tensorflow的Conv3D文档，默认形状是channels_last。但您可以将data_format参数更改为channels_last或channels_first。而且总是batch_size优先。因此，在您的情况下，正确的设置可以是

input_shape =(170, 60, 320, 120, 3)
Conv3D(n_filters, kernel_size, input_shape=input_shape[1:])

或

input_shape =(170, 3, 60, 320, 120)
Conv3D(n_filters, kernel_size, input_shape=input_shape[1:], data_format='channels_first')

相关内容

最新更新

热门标签：