Python Keras:过度拟合 Keras MLP,尽管损失曲线看起来没有过度拟合?



我使用Keras和Python来训练一个MLP-Sequential模型,用于对两个类进行分类。我的训练数据有247个功能,我有17个1类样本,922个2类样本。我使用烟雾边界线过采样算法来平衡数据集。我使用k=4的交叉验证来验证准确性和召回率的性能。对于每个折叠上的训练,我绘制了训练和验证过程中的损失曲线,以估计模型是否拟合不足或过拟合。

我训练了一个有3个隐藏层的模型,准确率达到95%,召回率达到71%。每个折叠的损失函数图似乎没有过度拟合。(stackoverflow不允许我发布图片(但与训练精度和召回率较差的模型相比,该模型的评估更差

这是否过拟合?如何在评估前检测到它

提前感谢!

您不能简单地从学习曲线中检测到过拟合。过度拟合的定义是当你的模型在训练集上表现得非常好,而在评估集上表现不佳时,这正是你所报告的。在这种情况下,我怀疑主要问题是数据集不平衡。您可以验证两个类在每个集合(训练、验证折叠和测试集(中的分布,并查看模型在少数类上的表现。

最新更新