当keras设置为TF格式时,以TH格式加载权重



我有Keras' image_dim_ordering属性设置为'tf',所以我定义我的模型如下:

model = Sequential()
model.add(ZeroPadding2D((1, 1), input_shape=(224, 224, 3)))
model.add(Convolution2D(64, 3, 3, activation='relu'))

但是当我调用load_weights方法时,它崩溃了,因为我的模型是使用"th"格式保存的:

Exception: Layer weight shape (3, 3, 3, 64) not compatible with provided weight shape (64, 3, 3, 3)

我如何加载这些权重并自动转置它们来修复Tensorflow的格式?

我问Francois Chollet这个问题(他没有SO账户),他友好地传递了这个回复:


"th"格式意味着卷积核的形状为(depth, input_depth, rows, cols)

"tf"格式意味着卷积核将具有(rows, cols, input_depth, depth)的形状

因此可以通过np.transpose(x, (2, 3, 1, 0))将前者转换为后者,其中x是卷积核的值。

下面是一些进行转换的代码:

from keras import backend as K
K.set_image_dim_ordering('th')
# build model in TH mode, as th_model
th_model = ...
# load weights that were saved in TH mode into th_model
th_model.load_weights(...)
K.set_image_dim_ordering('tf')
# build model in TF mode, as tf_model
tf_model = ...
# transfer weights from th_model to tf_model
for th_layer, tf_layer in zip(th_model.layers, tf_model.layers):
   if th_layer.__class__.__name__ == 'Convolution2D':
      kernel, bias = layer.get_weights()
      kernel = np.transpose(kernel, (2, 3, 1, 0))
      tf_layer.set_weights([kernel, bias])
  else:
      tf_layer.set_weights(tf_layer.get_weights())

如果模型包含Convolution2D层下游的Dense层,那么第一个Dense层的权重矩阵也需要被洗刷。

你可以使用这个脚本自动转换ano/tensorflow后端训练模型权重直接到后端/dim排序的其他3种可能的组合。

相关内容

  • 没有找到相关文章

最新更新