所以我想创建一个模型,可以将水果分类为;新鲜的";或";腐烂的";。目前我使用的数据集来自kaggle-https://www.kaggle.com/datasets/sriramr/fruits-fresh-and-rotten-for-classification
然后,我使用LabelImg为大约3400个图像(由新鲜苹果、腐烂苹果、新鲜橙子、腐烂橙子、新鲜香蕉和腐烂香蕉组成(应用边界框,但我没有使用6个不同的类别/标签,而是使用了2个称为";新鲜的";以及";腐烂的";。
目前我得到了非常好的结果,但我想扩大模型的规模,以便能够识别更多的水果,如猕猴桃。
做这件事的理想方式是什么?
我曾尝试将新鲜猕猴桃和腐烂猕猴桃的图像添加到现有的数据集中,并训练一个新的模型,但该模型仍然将新鲜猕猴桃归类为腐烂猕猴桃(我猜测这是因为3000多张苹果、橙子和香蕉的图像中,褐色与腐烂有关(。
我做一个有8个标签的新模型吗?所以"新鲜的苹果,腐烂的苹果,新鲜的猕猴桃,腐烂的猕猴桃&";。
当一个标签的图片比其他标签的图片多时,我不确定这种偏见是如何发挥作用的。
如果用不同的标签对它们进行分类,会更好地提高准确性。fresh apple
、rotten apple
、fresh kiwi
、rotten kiwi
等。之后,您可以将它们作为fresh
和rotten
进行集群并打印在代码中。