Keras 模型在 1 个 epoch 后有非常好的损失,但随着 epoch 的增加并没有真正变得更好



你好,我只是想问这个理论问题。一个模型在一个时期后已经有了很好的损失(归一化数据为0.004(,但这种损失并没有随着时间的推移而真正减少(10个时期后仍然是0.0032(,这可能是什么原因造成的

它不是应该随着时间的推移而减少吗?

数据集相当大,有100多万个数据点,我没想到在1个历元之后会有这么大的损失。

那么,我能改变这个模型吗?或者我做错了什么?(这是一个密集连接的神经网络,预测adam和mse的回归(

有多种可能性,但问题需要澄清。

你能指定目标的范围吗
0.004可能听起来很低,但如果你的目标范围在0到0.0001之间,就不是这样了。

你的验证标准是什么;测试数据集?在不知道验证损失的情况下,损失本身并不能说明什么。

猜测0.004太好了,不可能是真的,你的模型可能太拟合了。尝试执行丢弃以避免过度拟合。

如果你的模型没有过度拟合,可能是Adam超过了(局部(最小值。尝试降低它的学习率,或者尝试使用自定义超参数的sgd。这确实需要大量的调整。

Coursera上有一门免费课程,叫做斯坦福大学的"机器学习"。这很好地涵盖了这些概念的理论(以及更多(。

最新更新