我试图在keras中定义一个考虑样本权重的定制度量。拟合模型时,我使用样品权重如下:
training_history = model.fit(
train_data,
train_labels,
sample_weight = train_weights,
epochs = num_epochs,
batch_size = 128,
validation_data = (validation_data, validatation_labels, validation_weights ),
)
我正在使用的自定义度量标准的一个示例是AUC(ROC曲线下的区域),我将其定义如下:
from keras import backend as K
import tensorflow as tf
def auc(true_labels, predictions, weights = None):
auc = tf.metrics.auc(true_labels, predictions, weights = weights)[1]
K.get_session().run(tf.local_variables_initializer())
return auc
,我在编译模型时使用此指标:
model.compile(
optimizer = optimizer,
loss = 'binary_crossentropy',
metrics = ['accuracy', auc]
)
,但据我所知,该指标没有考虑样品权重。实际上,我通过比较使用上面定义的自定义度量训练模型时看到的度量值与通过模型输出和样本权重计算得出的度量值来验证了这一点,这确实产生了非常不同的结果。我将如何定义上面显示的AUC度量以考虑样品权重?
您可以使用将sample_weights
作为参数的另一个函数包装您的指标:
def auc(weights):
def metric(true_labels, predictions):
auc = tf.metrics.auc(true_labels, predictions, weights=weights)[1]
K.get_session().run(tf.local_variables_initializer())
return auc
return metric
然后定义一个将接收样品权重的额外输入占位持有人:
sample_weights = Input(shape=(1,))
然后,您的模型可以如下编译:
model.compile(
optimizer = optimizer,
loss = 'binary_crossentropy',
metrics = ['accuracy', auc(sample_weights)]
)
注意:未测试。