我正在尝试查找使用python中的PANDAS包创建的数据帧的树状图。示例数据如下所示。
import numpy as np
from pandas import *
import matplotlib.pyplot as plt
from hcluster import pdist, linkage, dendrogram
from numpy.random import rand
Index= ['aaa','bbb','ccc','ddd','eee']
Cols = ['A', 'B', 'C','D']
df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols)
>>> df
A B C D
aaa 0.987415 0.192240 0.709559 0.317106
bbb 0.856932 0.252441 1.183127 0.712855
ccc 1.687198 0.462673 1.046469 0.159287
ddd 0.977152 2.657582 0.491975 0.027280
eee 0.120464 0.945034 0.142658 0.537024
>>>
X = df.T.values #Transpose values
Y = pdist(X)
Z = linkage(Y)
dendrogram(Z)
上面的代码生成树状图,但错过了列名。我怎样才能跟踪相同的情况。
正如@Wouter Overmiere所建议的那样,以下内容对我有用。
X = df.T.values #Transpose values
Y = pdist(X)
Z = linkage(Y)
dendrogram(Z, labels = df.columns)