如何从 PyMC3 中的狄利克雷进程中提取分组数据的集群 ID



我正在使用PyMC3对分组数据进行聚类。基本上,我有 g 向量,并希望将 g 向量聚类到 m 个簇中。但是,我有两个问题。

第一个是,PyMC3似乎只能处理一维数据,而不能处理向量。第二个问题是,我不知道如何提取原始数据的集群 ID。我确实提取了分量的数量 (k( 和相应的权重。但是我无法提取指示每个点所属的集群的 id。

欢迎任何想法或意见!

如果我

理解正确,您正在尝试提取数据点属于哪个类别(1 到 k(。但是,狄利克雷随机变量仅产生概率向量。这应该用作分类 RV 的先验,当从中采样时,它将产生一个编号类别。

最新更新