我有一个模型,它有类似于"分类"one_answers"回归"的部分。我用乘法层把它们合并。在执行乘法之前,我想根据阈值将分类部分的输出设置为0或1。我试着使用带有自定义功能的Lambda层,如下所示,但我面临着各种错误,我对这些错误一无所知。一边走一边一个接一个地解决这些问题并不能增进我的理解。有人能解释一下如何定义修改值的自定义Lambda层函数吗?
我当前的Lambda层函数:(由于FailedPreconditionError: Attempting to use uninitialized value lstm_32/bias
而不工作)
def func(x):
a = x.eval(session=tf.Session())
a[x < 0.5] = 0
a[x >= 0.5] = 1
return K.variable(a)
回归部分:
input1 = Input(shape=(1, ))
model = Sequential()
model.add(Embedding(vocab_size + 1, embedding, input_length=1))
model.add(LSTM(hidden, recurrent_dropout=0.1, return_sequences=True))
model.add(LSTM(6))
model.add(Reshape((3,2)))
model.add(Activation('linear'))
分类部分:
input2 = Input(shape=(1, ))
model2 = Sequential()
model2.add(Embedding(vocab_size + 1, embedding, input_length=1))
model2.add(LSTM(hidden, recurrent_dropout=0.1, return_sequences=True))
model2.add(LSTM(1))
model2.add(Activation('sigmoid'))
model2.add(???) # need to add 0-1 thresholding here
合并两部分:
reg_head = model(input1)
clf_head = model2(input2)
merge_head = multiply(inputs=[clf_head, reg_head])
m2 = Model(inputs=[input1, input2], outputs=merge_head)
在func
中,不能eval
张量。
使用张量的想法是;"连接";(他们称之为图形)在整个模型中从头到尾。这种连接允许模型计算梯度。如果您评估一个张量并尝试使用这些值,您将断开连接。
此外,为了获取张量的实际值,您需要输入数据。并且只有当您调用fit
、predict
和类似方法时,输入数据才会存在。在构建阶段没有数据,只有表示和连接。
一个仅使用张量的可能函数是:
def func(x):
greater = K.greater_equal(x, 0.5) #will return boolean values
greater = K.cast(greater, dtype=K.floatx()) #will convert bool to 0 and 1
return greater
但是要小心!这是不可微分的。从现在起,这些值将在模型中被视为常量。这意味着在此点之前的权重在训练期间不会更新(您不会通过m2
训练分类模型,但您仍然可以从model2
训练它)。有一些奇特的解决方法,如果你需要,请写一条评论。
在Lambda
层中使用此功能:
model.add(Lambda(func, output_shape=yourOutputShapeIfUsingTheano))