熊猫数据框的网络带颜色



我需要使用以下数据创建一个网络

String        List1                           
string1 [string3, string2, string20, string4]   
string2 [string100, string1, string4]
string3 [string1, string80, string2]
string4 [string13, string28, string12, string16]
string5 [string3, string8, string12, string6]
string6 []  

带有间接链接,显示变量/节点之间的链接。例如,string1与string3, string2, string30, string4相连。String2与string100、string1、string4等链接。

我尝试使用Networkx

import itertools.combinations as comb
edges = set()
for col in df:
for _, data in df.groupby(col):
edges.update(comb(data.index, 2))
G = nx.Graph()
G.add_nodes_from(df.index)
G.add_edges_from(edges)

但是它没有做我期望的输出。

确实应该使用df.explodenetworkx有一个函数,您可以将分解后的df直接输入:

G = nx.from_pandas_edgelist(df.explode('List1'), source='String', target='List1')

也就是说,构建数据框架的方式(即作为单元格条目的列表)会引起很多麻烦,因此最好避免这种方式。

最新更新