如何在多标签问题中为tensorflow模型设置类权重



我试图训练一个模型来通过图像预测几个标签。输出是一个包含五个二进制值的列表,如[0,0,0,1,1]

我使用S形密集层来获得输出,下面是我的代码:

inp = tf.keras.layers.Input(shape = (*IMAGE_SIZE, 3), name = 'inp')
x = tfka.ResNet50(weights = 'imagenet', include_top = False)(inp)
x = tf.keras.layers.GlobalAveragePooling2D()(x)
output = tf.keras.layers.Dense(label_dim, activation='sigmoid')(x)
model = tf.keras.models.Model(inputs = [inp], outputs = [output])

现在,我的问题是我的数据集不平衡。很难使其平衡,因为每行有五个标签。所以,我试图为每个标签设置不同的类权重,但我不知道如何做到

我尝试

class_weight = {'label-1': 1:2, 'label-2': 1:5, 'label-3': 1:1, 'label-4': 2:1, 'label-5': 1:10}

但它不起作用。

我的目标是为所有类和标签分配不同的权重。像这个

在第一个标签中,0类的重量为0.5,1类的重量是1

在第二个标签中,0类的重量为0.1,1类的重量是1

更新:

我想我应该把我的模型分成五个小模型,因为我想要的是最大限度地减少每个标签的损失,而不是标签列表。因此,将其转换为几个单一的二进制分类模型是一个更好的选择。

在拟合模型时传递每个类的权重。Tensorflow的文档指定,当调用.fit((时,可以传递一个包含类权重的字典。请确保检查该字典的外观,因为它只接受整数(键(和浮点(权重(格式。

最新更新