根据分布计算元素的可能性



基于训练数据集,我计算了协方差矩阵和均值向量,如下

mean_vector = training_set.mean(0) 
covariance_matrix = np.cov(training_set, rowvar=False) 

我使用创建了一个以这些值为特征的分布

np.random.multivariate_normal(mean_vector, covariance_matrix)

我想计算测试集中特定条目的可能性,但我不确定如何在Python中估计这种可能性。

我一直在阅读似然估计的概念,以及它与pdf的区别,但我不确定如何在我的代码中实现这一点,任何指针都将不胜感激。

您可以使用scipy.stats中的multivariate_normal类。它有一个pdf方法,可以为您提供数据点的概率。我想这就是你要做的。

from scipy.stats import multivariate_normal as mvn
dist = mvn(mean_vector, covariance_matrix)
ll = dist.pdf(data)

最新更新