我目前正在做一个图像分类任务,涉及到漫画灰度图像的大数据集,我的CNN需要对它们进行分类。目前,我的模型的测试精度约为88%,但我知道更高的精度是可能的。
我试过:
- 改进/更改实际模型/架构
- 使用不同的元参数
- pytorch库中的不同损失函数
- 一堆不同的变换
- 不同于torch.optim的优化
我还尝试了火炬视觉中包含的一些标准模型。模型和测试集的准确率仍然低于90%。
我是否只需要继续尝试上述方法来提高准确性,或者我可以尝试其他方法?我真的很感激任何建议,我能想到的唯一一件事就是为数据集制作自己的自定义损失函数,但我不确定这有多大帮助?
从您所描述的情况来看,似乎值得在数据准备上花费一些时间。这里有一篇很好的文章,关于如何为图像做到这一点。你可以尝试以下方法:
- 将所有图像调整为固定大小
- 减去平均像素值,即归一化数据集
我真的不知道你在做什么,但我也会考虑添加一些可能相关的额外功能,看看是否有帮助。