scikit学习GMM产生正对数概率

我使用python scikit学习包中的高斯混合模型来训练我的数据集，然而，当我编码时，我发现

--G=混合物。GMM（…）

--G.fit（…）

--G.score（总和特征）

得到的对数概率是正实数。。。为什么？对数概率不是保证为负吗？

我明白了，高斯混合模型返回给我们的是对数概率"密度"，而不是概率"质量"，所以正值是完全合理的。

如果协方差矩阵接近奇异，那么GMM将不能很好地执行，通常这意味着数据不适合这种生成任务

正对数概率是可以的。

请记住，GMM计算的概率是一个概率密度函数（PDF），因此在任何一点上都可能大于1。

限制是PDF必须集成到数据域上的一个。

如果对数概率增长得非常大，那么推理算法可能已经达到退化解（如果数据集较小，则与最大似然估计很常见）。

为了检查GMM算法是否没有达到退化解，您应该查看每个分量的方差。如果任何一个方差接近于零，那么这就很糟糕。作为一种选择，你应该使用贝叶斯模型，而不是最大似然估计（如果你还没有这样做的话）。

相关内容