为什么我们使用正则化来训练神经网络



在我的理解中,我认为这是为了避免过度/欠拟合,并加快计算速度。对吗?

你的理解是部分正确的。正则化无助于欠拟合。它可以(在某种程度上)防止过度拟合。此外,它不会加快计算速度(因为通过添加正则化来计算某些东西实际上更复杂),但会导致更简单的优化问题 - 因此收敛所需的步骤更少(因为产生的误差表面更平滑)。

最新更新