Python Keras：过度拟合 Keras MLP，尽管损失曲线看起来没有过度拟合？

我使用Keras和Python来训练一个MLP-Sequential模型，用于对两个类进行分类。我的训练数据有247个功能，我有17个1类样本，922个2类样本。我使用烟雾边界线过采样算法来平衡数据集。我使用k=4的交叉验证来验证准确性和召回率的性能。对于每个折叠上的训练，我绘制了训练和验证过程中的损失曲线，以估计模型是否拟合不足或过拟合。

我训练了一个有3个隐藏层的模型，准确率达到95%，召回率达到71%。每个折叠的损失函数图似乎没有过度拟合。(stackoverflow不允许我发布图片(但与训练精度和召回率较差的模型相比，该模型的评估更差

这是否过拟合？如何在评估前检测到它

提前感谢！

您不能简单地从学习曲线中检测到过拟合。过度拟合的定义是当你的模型在训练集上表现得非常好，而在评估集上表现不佳时，这正是你所报告的。在这种情况下，我怀疑主要问题是数据集不平衡。您可以验证两个类在每个集合(训练、验证折叠和测试集(中的分布，并查看模型在少数类上的表现。

相关内容

最新更新

热门标签：