熊猫如何将两列转换为没有重复项的组列表



>我有类似示例的数据帧:

a b
a c
b c
d e

如何转换为没有熊猫或 R 重复的列表:

a,b,c
d,e

这是一个网络问题,所以networkx很有帮助:

import networkx as nx
G = nx.Graph()
G.add_edges_from([(a,b) for a,b in zip(df[0],df[1])])
list(nx.connected_components(G))

输出:

[{'a', 'b', 'c'}, {'d', 'e'}]

最新更新