使用多个特征/变量在节点之间创建边



我正在尝试创建一个网络,连接共享至少一个特征的节点,而不仅仅是"one_answers";to"列。我可以在Python或r中完成。

例如,我有包含电子邮件、电话号码、文档id和城市的事务数据。我希望能够链接共享至少一个前面提到的功能的所有事务(节点)。

感谢编辑:

在图中我们有三个不同的"组"。它们应该都在同一个"组"中。或";network"。因为约翰和朱利安喜欢的颜色相同,约翰和保罗的城市相同,杰西卡和约翰的出生年份相同,所以他们都在第一组。Sean是孤独的,因为他没有任何共同的属性,而Tina和Martin共享城市。

网络dataframe

让我们假设每个事务是一个值向量,其中每个条目对应于一个特定的特征。然后,我将用于此任务的一个简单伪代码是:

for transaction_1 in transactions:
for transaction_2 in transactions:
if any((transaction_1 - transaction_2) == 0):
create_edge(transaction_1, transation_2)

最新更新