Python:合并两个对象"identity"不相等的列表



我试图合并两个列表,baseoverride,其中base应该是一个较大的列表,overridebase中事物的子集。在元素重叠的地方,我希望base中的对象被override中的对象覆盖。每个列表中的对象都是带有属性al2000de2000的命名元组。此外,当它们具有相同的al2000de2000值时,我想将对象视为"相同"。我所拥有的(似乎有效)在下面,但这有嵌套循环,我想知道是否有更好的方法来做到这一点。

# Part of a function
final = []
for i in base:
    if all((i.al2000, i.de2000) != (k.al2000, k.de2000) for k in override):
        final.append(i)
    else:
        for k in override:
            if (i.al2000, i.de2000) == (k.al2000, k.de2000):
                final.append(k)
return final

您可以使用for/else构造

final = []
for i in base:
    for k in override:
        if (i.al2000, i.de2000) == (k.al2000, k.de2000):
            # found an override
            final.append(k)
            break
    else:
        final.append(i)

该解决方案仍然使用嵌套的for循环,但它从原始解决方案中删除了代码重复(迭代overrides,比较ik)。

您可以使用字典和几个字典理解式。

uniques = {(x.al2000, x.de2000): x for x in base}
uniques.update({(x.al2000, x.de2000): x for x in override})
final = uniques.values()

修改为保留override中省略额外值的原始行为。

uniques = {(x.al2000, x.de2000): x for x in base}
for value in override:
    key = value.al2000, value.de2000
    if key in uniques:
        uniques[key] = value
# here's the comprehension version, although it's a bit rough on the eyes
# uniques.update({(x.al2000, x.de2000): x for x in override if (x.al2000, x.de2000) in uniques})
final = uniques.values()

这个答案采用了@acushner的建议,使用字典,这在您的情况下可能是最自然的方法。此外,在处理覆盖时,ChainMap很有用,在许多情况下,它是表示数据结构的最自然的方式。

from collections import ChainMap
base_dct = {(x.al2000, x.de2000): x for x in base}
override_dct = {(x.al2000, x.de2000): x for x in override}
z = ChainMap(base_dct, override_dct)
# then access:
z.values()
# or:
z[(x.al2000, x.de2000)]

既然你真正想做的是在重写中查找一些东西,那么就把它变成一个字典:

od = {(x.al2000, x.de2000): x for x in override}

现在,只需创建结果:

res = [od.get((b.al2000, b.de2000), b) for b in base]

*没有测试,但应该没问题

最新更新