>我有类似示例的数据帧:
a b
a c
b c
d e
如何转换为没有熊猫或 R 重复的列表:
a,b,c
d,e
这是一个网络问题,所以networkx
很有帮助:
import networkx as nx
G = nx.Graph()
G.add_edges_from([(a,b) for a,b in zip(df[0],df[1])])
list(nx.connected_components(G))
输出:
[{'a', 'b', 'c'}, {'d', 'e'}]