可变自动编码器:MSE与BCE



我正在使用变分自动编码器,我看到有些人使用MSE损失,有些人使用BCE损失,有人知道其中一个是否比另一个更正确吗?为什么?

据我所知,如果你假设VAE的潜在空间向量遵循高斯分布,你应该使用MSE损失。如果你假设它遵循多项式分布,你应该使用BCE。此外,BCE偏向于0.5。

有人能给我澄清一下这个概念吗?我知道它与信息期望的变分下界项有关。。。

非常感谢!

简而言之:最大化预测为正态分布(多项式分布(的模型的可能性相当于最小化MSE(BCE(

数学细节:

使用MSE和交叉熵损失函数的真正原因

DeepMind有一个关于现代潜在变量模型的精彩讲座(主要是关于变分自动编码器(,你可以在那里了解你需要的一切

相关内容

  • 没有找到相关文章

最新更新