我需要使用以下数据创建一个网络
String List1
string1 [string3, string2, string20, string4]
string2 [string100, string1, string4]
string3 [string1, string80, string2]
string4 [string13, string28, string12, string16]
string5 [string3, string8, string12, string6]
string6 []
带有间接链接,显示变量/节点之间的链接。例如,string1与string3, string2, string30, string4相连。String2与string100、string1、string4等链接。
我尝试使用Networkx
import itertools.combinations as comb
edges = set()
for col in df:
for _, data in df.groupby(col):
edges.update(comb(data.index, 2))
G = nx.Graph()
G.add_nodes_from(df.index)
G.add_edges_from(edges)
但是它没有做我期望的输出。
确实应该使用df.explode
。networkx
有一个函数,您可以将分解后的df直接输入:
G = nx.from_pandas_edgelist(df.explode('List1'), source='String', target='List1')
也就是说,构建数据框架的方式(即作为单元格条目的列表)会引起很多麻烦,因此最好避免这种方式。