是在使用Tensorflow/ Keras时的第一维宽度或高度



我使用Keras和Tensorflow,认为Input(shape=(1280,224,1)将接受灰度的张量图像宽度=1280身高= 224这就是我在ResNetImagedataGeneratorflow_from_directory(target_size=(1280,224))中使用的所有预训练模型。

在ResNet50 github代码中给出了宽度和高度:

input_shape:可选的形状元组,只能指定如果include_top为False(否则输入形状必须是(224, 224, 3)(与channels_last数据格式)或(3, 224, 224)(具有channels_first数据格式)。它应该有3个输入通道,and宽度和高度应不小于32。

但是我突然发现了tf.image.resize其中参数给出为:

size: A 1-D 2元张量:new_height, new_width。图片的新大小

要么我的整体是一个错误,要么这里的功能不同。请帮助。

请纠正我,但我想我已经找到答案了。通过查看Conv2D文档,我发现:

data_format:一个字符串,channels_last(默认)或channels_first之一。输入维度的排序。channels_last对应于形状(batch_size,高度,宽度)的输入而channels_first对应于形状(batch_size, channels,height, width)的输入(. 它默认为在~/. Keras/Keras .json的Keras配置文件中找到的image_data_format值。如果不设置,则为channels_last。

ImageDataGenerator的文档也是这样说的:

data_format图像数据格式,要么"channels_first"或";channels_last"。"channels_last"模式意味着图像应该有形状(样本,高度,宽度,通道),channels_first;模式意味着图像应该有形状(采样,通道,高度,宽度)。它默认为在~/. Keras/Keras .json的Keras配置文件中找到的image_data_format值。如果您从未设置它,那么它将是&;channels_last&;

所以我认为tf/Keras使用height,widthPILpillow使用width,height格式的文档说:

size -请求的大小,以像素为单位,为二元组:(width, height).

请纠正

相关内容

  • 没有找到相关文章

最新更新