我对机器学习很陌生。看看其他工作,我培训了以下模型https://www.kaggle.com/code/konstansan/cat-and-flower-image-classifier,基于测试集的计算,其显示出非常高的精度(98-99%(。要运行笔记本,需要一个Kaggle帐户。
然而,大多数情况下,该模型无法准确地对来自测试集的单个图像进行分类。我有两个类别,训练集中每个类别10000张图像,验证集中每个类别2000张图像,测试集中每个类别50张图像。三组图像在大小、内容等方面没有太大差异。
然后我训练了一个类似的模型,它的准确率约为85%,但在单个图像上仍然失败。
有人能帮忙吗?非常感谢。
听起来模型的准确性在训练集上很好,但在测试集上却不起作用。
这可能是由于以下任何原因:
- 因为算法
- 由于超参数
- 由于数据过拟合
- 因为数据可能不好