我正在处理一个时间序列数据集,因此在拟合scikit-learn
包中的GaussianMixture()
函数时,我需要使每个特征(时间戳)依赖于。但是,在检查源代码后,我没有找到自定义协方差矩阵的参数。
凭借我有限的统计知识,我很好奇如何在 E 步骤中修改协方差矩阵以将时间依赖性纳入 GMM 模型。谢谢。
这是源代码:我想做的更改是在 estimate_gaussian_parameters() 函数中 https://github.com/scikit-learn/scikit-learn/blob/7389dba/sklearn/mixture/gaussian_mixture.py#L435
在darksky的帮助下,我了解到该函数是内置的,可以选择协方差矩阵。参数covariance_type有 4 个选项: 'full'(每个分量都有自己的通用协方差矩阵), "并列"(所有分量共享相同的通用协方差矩阵), 'diag'(每个分量都有自己的对角协方差矩阵), "球形"(每个分量都有自己的单一方差)。
在我的理解中,"球形"用于单变量数据集,"diag"用于具有多变量但独立特征的数据集。因此,如果他们想预测多变量和依赖特征,应该使用"完整"或"捆绑"。