conv3d的Tensorflow输入形状



我有(x,y)高度和宽度的视频,我将视频大小调整为高度320和宽度120,使用3通道RGB。现在我从视频中合并60帧,并从10200帧中创建了60的深度。现在我不确定用conv3d训练模型,我的输入形状(170,60,320,120,3)是否正确。对于tensorflow中的input_shape,这个格式(batch, depth, height, width, channel)是否正确?

根据最新版本tensorflow的Conv3D文档,默认形状是channels_last。但您可以将data_format参数更改为channels_lastchannels_first。而且总是batch_size优先。因此,在您的情况下,正确的设置可以是

input_shape =(170, 60, 320, 120, 3)
Conv3D(n_filters, kernel_size, input_shape=input_shape[1:])

input_shape =(170, 3, 60, 320, 120)
Conv3D(n_filters, kernel_size, input_shape=input_shape[1:], data_format='channels_first')

相关内容

  • 没有找到相关文章

最新更新