我使用networkx构建了一个图,networkx是一个以人为节点,以消息频率为边缘权重的社交网络。我想把这个网络分成不同的人群。那些经常互相发信息的人往往在同一组。我该怎么做?我应该使用哪种聚类算法?此外,我如何将分组可视化为树状图树?
提前感谢!:D附言:我尝试过python louvain进行分区,但结果不准确,比如它将两个用户划分为不同的组,即使他们的消息频率很高
我尝试过python louvain进行分区,但结果不准确[…]
Louvain方法并不完美,也没有完美的方法,它们总是取决于你试图实现的目标(见本文的结论(。
[…]类似于它将两个用户划分为不同的组,即使他们的消息频率很高。
看起来这个用户可能属于多个社区。。。也许可以尝试一种允许重叠社区的划分方法,比如K-Clique。这种划分方法允许节点属于多个社区。
算法:
以下是我发现的一些替代算法:
-
networkX软件包中已经包含了许多算法(此处(。我建议使用
girvan_newman
,但它需要大量的计算能力。。。 -
CDLib包也有许多用于networkX的算法(此处(,包括一些允许重叠社区的算法。此外,检查一下leiden算法,你可能更喜欢它而不是louvain,它应该更好(根据他们的论文(
-
我仍然建议使用python louvain,用于清晰的社区
祝你好运!