根据分布计算元素的可能性

基于训练数据集，我计算了协方差矩阵和均值向量，如下

mean_vector = training_set.mean(0) 
covariance_matrix = np.cov(training_set, rowvar=False)

我使用创建了一个以这些值为特征的分布

np.random.multivariate_normal(mean_vector, covariance_matrix)

我想计算测试集中特定条目的可能性，但我不确定如何在Python中估计这种可能性。

我一直在阅读似然估计的概念，以及它与pdf的区别，但我不确定如何在我的代码中实现这一点，任何指针都将不胜感激。

您可以使用scipy.stats中的multivariate_normal类。它有一个pdf方法，可以为您提供数据点的概率。我想这就是你要做的。

from scipy.stats import multivariate_normal as mvn
dist = mvn(mean_vector, covariance_matrix)
ll = dist.pdf(data)

相关内容