在列表中查找不常见的元素

我正在尝试编写一段可以自动分解表达式的代码。例如如果我有两个列表 [1,2,3,4] 和 [2,3,5]，代码应该能够在两个列表 [2,3] 中找到公共元素，并将其余元素组合到一个新列表中，即 [1,4,5]。

来自这篇文章：如何找到列表交集？我看到公共元素可以通过以下方式找到

set([1,2,3,4]&set([2,3,5]).

有没有一种简单的方法可以从每个列表中检索不常见的元素，在我的示例中是 [1,4] 和 [5]？

我可以继续做一个 for 循环：

lists = [[1,2,3,4],[2,3,5]]
conCommon = []
common = [2,3]
for elem in lists:
    for elem in eachList:
    if elem not in common:
        nonCommon += elem

但这似乎是多余和低效的。Python是否提供了任何方便的函数来做到这一点？提前感谢！！

对 set s 使用对称差分运算符（也称为 XOR 运算符）：

>>> set([1,2,3]) ^ set([3,4,5])
set([1, 2, 4, 5])

老问题，但看起来python有一个内置函数来提供您正在寻找的内容：.difference()。

例

list_one = [1,2,3,4]
list_two = [2,3,5]
one_not_two = set(list_one).difference(list_two)
# set([1, 4])
two_not_one = set(list_two).difference(list_one)
# set([5])

这也可以写成：

one_not_two = set(list_one) - set(list_two)

定时

我对两者都进行了一些时序测试，似乎.difference()略有优势，达到 10 - 15%，但每种方法都需要大约八分之一秒来过滤 1M 项目（500 到 100,000 之间的随机整数），所以除非你对时间非常敏感，否则它可能无关紧要。

其他注意事项

OP 似乎正在寻找一种提供两个单独列表（或集合）的解决方案 - 一个列表包含第二个列表中没有的项目，反之亦然。前面的大多数答案都返回包含所有项目的单个列表或集合。

还有一个问题是，第一份清单中可能重复的项目是应该多次计算，还是只计算一次。

如果 OP 想要维护重复项，可以使用列表推导，例如：

one_not_two = [ x for x in list_one if x not in list_two ]
two_not_one = [ x for x in list_two if x not in list_one ]

。这与原始问题中提出的解决方案大致相同，只是干净一点。此方法将保留原始列表中的重复项，但对于较大的数据集，此方法的速度要慢得多（如多个数量级）。

你可以使用交叉概念来处理这类问题。

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
set(b1).intersection(b2)
Out[22]: {4, 5}

使用此代码的最好的事情是它对于大数据也非常快。当我使用此逻辑时，我有带有 607139 的 b1 和带有 296029 元素的 b2，我在 2.9 秒内得到结果。

可以使用

.__xor__属性方法。

set([1,2,3,4]).__xor__(set([2,3,5]))

或

a = set([1,2,3,4])
b = set([2,3,5])
a.__xor__(b)

您可以使用symmetric_difference命令

x = {1,2,3}y = {2,3,4}

z = 设置差（x，y）

输出将为：z = {1,4}

这应该得到共同元素和剩余元素

lis1=[1,2,3,4,5,6,2,3,1]
lis2=[4,5,8,7,10,6,9,8]
common = list(dict.fromkeys([l1 for l1 in lis1 if l1 in lis2]))
remaining = list(filter(lambda i: i not in common, lis1+lis2))

common = [4, 5, 6]

remaining = [1, 2, 3, 2, 3, 1, 8, 7, 10, 9, 8]

所有好的解决方案，从基本的DSA风格到使用内置函数：

# Time: O(2n)
def solution1(arr1, arr2):
  map = {}
  maxLength = max(len(arr1), len(arr2))
  for i in range(maxLength):
    if(arr1[i]):
      if(not map.get(arr1[i])):
        map[arr1[i]] = [True, False]
      else:
        map[arr1[i]][0] = True
    if(arr2[i]):
      if(not map.get(arr2[i])):
        map[arr2[i]] = [False, True]
      else:
        map[arr2[i]][1] = False
  res = [];
  for key, value in map.items():
    if(value[0] == False or value[1] == False):
      res.append(key)
  return res
def solution2(arr1, arr2):
  return set(arr1) ^ set(arr2)
def solution3(arr1, arr2):
  return (set(arr1).difference(arr2), set(arr2).difference(arr1))
def solution4(arr1, arr2):
  return set(arr1).__xor__(set(arr2))
print(solution1([1,2,3], [2,4,6]))
print(solution2([1,2,3], [2,4,6]))
print(solution3([1,2,3], [2,4,6]))
print(solution4([1,2,3], [2,4,6]))

相关内容

最新更新

热门标签：