我试图训练一个模型来通过图像预测几个标签。输出是一个包含五个二进制值的列表,如[0,0,0,1,1]
我使用S形密集层来获得输出,下面是我的代码:
inp = tf.keras.layers.Input(shape = (*IMAGE_SIZE, 3), name = 'inp')
x = tfka.ResNet50(weights = 'imagenet', include_top = False)(inp)
x = tf.keras.layers.GlobalAveragePooling2D()(x)
output = tf.keras.layers.Dense(label_dim, activation='sigmoid')(x)
model = tf.keras.models.Model(inputs = [inp], outputs = [output])
现在,我的问题是我的数据集不平衡。很难使其平衡,因为每行有五个标签。所以,我试图为每个标签设置不同的类权重,但我不知道如何做到
我尝试
class_weight = {'label-1': 1:2, 'label-2': 1:5, 'label-3': 1:1, 'label-4': 2:1, 'label-5': 1:10}
但它不起作用。
我的目标是为所有类和标签分配不同的权重。像这个
在第一个标签中,0类的重量为0.5,1类的重量是1
在第二个标签中,0类的重量为0.1,1类的重量是1
更新:
我想我应该把我的模型分成五个小模型,因为我想要的是最大限度地减少每个标签的损失,而不是标签列表。因此,将其转换为几个单一的二进制分类模型是一个更好的选择。
在拟合模型时传递每个类的权重。Tensorflow的文档指定,当调用.fit((时,可以传递一个包含类权重的字典。请确保检查该字典的外观,因为它只接受整数(键(和浮点(权重(格式。