在元组列表中查找重叠元素?

根据我对交集函数的理解，它发现列表中元素之间完全重叠。例如：

tup_1 = [(1,2,3),(4,5,6)]
tup_2 = [(4,5,6)]
ol_tup = set(tup_1).intersection(tup_2)
print ol_tup

将产生：

set([(4, 5, 6)])

但是，假设我的元组列表设置为如下：

tup_1 = [(1,2,3),(4,5,5)]
tup_2 = [(4,5,6)]

tup_1 中第二个元组和 tup_2 中第一个元组的 2 个元素重叠。如果我想 python 返回这两个元组：(4,5,5( 和 (4,5,6(，有没有比这个嵌套的 for 循环(下面(更简单的方法？

for single_tuple_1 in tup_1:
for single_tuple_2 in tup_2:
if single_tuple_1[0] == single_tuple_2[0] and single_tuple_1[1] == single_tuple_2[1]:
print single_tuple_1,single_tuple_2

编辑：

对于这种情况，假设顺序很重要，并假设元组包含 5 个元素：

tup_1 = [(1,2,3,4,5),(4,5,6,7,8),(11,12,13,14,15)]
tup_2 = [(1,2,3,4,8),(4,5,1,7,8),(11,12,13,14,-5)]

我想找到在各自的前 4 个元素中相互相交的元组。所以结果应该是：

[(1,2,3,4,5),(1,2,3,4,8),(11,12,13,14,15),(11,12,13,14,-5)]

代码将如何更改以适应这种情况？

如果你想返回所有"重叠"元组对，就没有办法比较所有对，即二次算法。但是您可以使用列表推导式使代码更加优雅，product用于组合和zip，sum用于比较：

>>> tup_1 = [(1,2,3),(4,5,5),(7,8,9)]
>>> tup_2 = [(4,5,6),(0,5,5),(9,8,7)]
>>> [(a, b) for (a, b) in itertools.product(tup_1, tup_2)
...         if sum(1 for ai, bi in zip(a, b) if ai == bi) >= 2]
[((4, 5, 5), (4, 5, 6)), ((4, 5, 5), (0, 5, 5))]

注意：这将检查两个元组是否在至少两个位置具有相同的元素，即顺序很重要。如果顺序无关紧要，您可以将a和b转换为set并检查它们的交集大小，但对于重复的数字，这可能会失败，即(1,1,2)和(1,1,3)的交集只是1而不是2。

如果只想匹配前两个元素，或者前两个和后两个元素，则可以以一致的析取方式比较元组的切片：

>>> [(a, b) for (a, b) in itertools.product(tup_1, tup_2)
...         if a[:2] == b[:2]]
[((4, 5, 5), (4, 5, 6))]
>>> [(a, b) for (a, b) in itertools.product(tup_1, tup_2)
...         if a[:2] == b[:2] or a[-2:] == b[-2:]]
[((4, 5, 5), (4, 5, 6)), ((4, 5, 5), (0, 5, 5))]

这是使用列表推导的一种方式。书面逻辑检查至少 2 个元素的重叠。

请注意，如果没有重叠，您将只剩下tup_2的一个元素，但这可以简单地识别。

from itertools import chain
tup_1 = [(1,2,3),(4,5,5)]
tup_2 = [(4,5,6)]
y = sorted(tup_2[0])
res = [i for i in chain(tup_1, tup_2) if
sum(i==j for i, j in zip(sorted(i), y)) > 1]
print res
[(4, 5, 5), (4, 5, 6)]

相关内容

最新更新

热门标签：