我使用Keras和Tensorflow,认为Input(shape=(1280,224,1)
将接受灰度的张量图像宽度=1280和身高= 224这就是我在ResNet
或ImagedataGeneratorflow_from_directory(target_size=(1280,224))
中使用的所有预训练模型。
在ResNet50 github代码中给出了宽度和高度:
input_shape:可选的形状元组,只能指定如果
include_top
为False(否则输入形状必须是(224, 224, 3)
(与channels_last
数据格式)或(3, 224, 224)
(具有channels_first
数据格式)。它应该有3个输入通道,and宽度和高度应不小于32。
但是我突然发现了tf.image.resize其中参数给出为:
size: A 1-D 2元张量:new_height, new_width。图片的新大小
要么我的整体是一个错误,要么这里的功能不同。请帮助。
请纠正我,但我想我已经找到答案了。通过查看Conv2D文档,我发现:
data_format:一个字符串,channels_last(默认)或channels_first之一。输入维度的排序。channels_last对应于形状(batch_size,高度,宽度)的输入而channels_first对应于形状(batch_size, channels,height, width)的输入(. 它默认为在~/. Keras/Keras .json的Keras配置文件中找到的image_data_format值。如果不设置,则为channels_last。
ImageDataGenerator的文档也是这样说的:
data_format图像数据格式,要么"channels_first"或";channels_last"。"channels_last"模式意味着图像应该有形状(样本,高度,宽度,通道),channels_first;模式意味着图像应该有形状(采样,通道,高度,宽度)。它默认为在~/. Keras/Keras .json的Keras配置文件中找到的image_data_format值。如果您从未设置它,那么它将是&;channels_last&;
所以我认为tf/Keras
使用height,width
而PIL
或pillow
使用width,height
格式的文档说:
size -请求的大小,以像素为单位,为二元组:(width, height).
请纠正