python中的变量聚类



我有数百个具有二进制值的变量,即1&0和我想看看这些变量是如何归入不同的集群的?我看不到任何可应用的python方法。但我可以在R中看到一个:http://arxiv.org/pdf/1112.0295.pdf

例如,我有变量(特征)为a1、a2、a3、a4……的数据,。。。。。。。,a100。每个a都是二进制变量。我不想在观测上应用聚类,而是想在a1,a2,…上应用聚类,。。。,a100,并且希望看到簇a1落在或a2落在哪个簇中。

有人知道python中类似的包或方法吗?我试着在Anaconda中应用R接口,这样我就可以使用R方法,但接口不起作用。

Python 3.4.3 | Anaconda 2.3.0(64位)|

首先转置您的数据矩阵。

然后集群功能而不是实例!

scikit learn包正是您想要的。

它包含了许多聚类算法,如K-meansAffinity propagationMean-shiftSpectral clusteringWard hierarchical clusteringAgglomerative clusteringDBSCANGaussian Mixtures等。。

最新更新