我想在Eurosat rgb数据集中使用EfficientNet进行迁移学习。我的问题是它似乎没有学到东西。
首先,我从下面的模型开始,使用MobileNet进行迁移学习,它运行良好(1(
model_base = tf.keras.applications.MobileNet(weights='imagenet', include_top=False, input_shape=input_shape=(224,224,3))
model_base.trainable=False
model = tf.keras.Sequential([
model_base,
tf.keras.layers.GlobalAveragePooling2D(name="avg_pool"),
tf.keras.layers.Dense(10, activation="softmax", name="predictions")
])
然后,我从MobileNet变成了EfficientNetB1,突然它什么都没学到(2(。然后,如果我尝试使用model_base.trainable=True,训练准确性会提高,但验证准确性不会提高(3(。
我做错了什么?
如果我在没有过渡学习的情况下使用EfficientNet,我也会得到很好的结果(4(,但这显然需要很多时间。我也尝试过将优化器从sgd更改为adam,但都不起作用。
我认为,对于Mobilenet,预处理函数将图像缩放到-1到+1之间。然而,对于EfficientNetB1,此处的文档说明
Note: each Keras Application expects a specific kind of input preprocessing.
For EfficientNet, input preprocessing is included as part of the model
(as a Rescaling layer), and thus tf.keras.applications.efficientnet.preprocess_input
is actually a pass-through function.
EfficientNet models expect their inputs to be float tensors of pixels with values
in the [0-255] range.
因此,当您从Mobilenet更改为Efficientnet时,请确保删除像素值的任何重新缩放