我对图应用了Leiden算法,并希望检索每个聚类索引的实际数据。目前,我有12个集群,并试图采取第一个索引数据,以便我可以将id转换为名称,以便交叉检查数据。
leid1 = G.community_leiden(objective_function="modularity", weights='weight_cosine',
n_iterations=500)
leid2 = G.modularity(leid1, weights='weight_cosine')
现在,当我试图获得索引为0的集群成员时。我得到的结果的索引,因为我需要集群的实际数据。我刚到柏林和莱顿,谁能告诉我我到底在哪里失踪了?
我的实际数据是这样的
Clustering with 4875 elements and 9 clusters
[0] 7.0, 21.0, 22.0, 34.0, 65.0, 78.0, 96.0, 178.0, 182.0, 954182.0, 954184.0,
954188.0, 954189.0, 954194.0, 954195.0, 954196.0, 954198.0, 954207.0,
954210.0, 954213.0, 954215.0, 954216.0, 954218.0, 954223.0, 954225.0,....
print (leid1[0])
[0, 2, 3, 4, 5, 6, 7, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, ..
但是我需要检索实际数据而不是索引。
您已经注意到,社区号c
在leid1[c]
中有可用的节点索引。你可以访问顶点序列,例如G.vs[leid1[c]]
,然后你可以检索一个特定的顶点属性,例如'name'
,像G.vs[leid1[c]]['name']
。