Python 的 set() 和 set([]) 之间的速度差异是什么？

这两个代码片段的速度差异很大吗？

x = set( i for i in data )

对：

阿拉伯数字。

x = set( [ i for i in data ] )

我看到有人推荐set()而不是set([]);这只是风格问题吗？

形式

x = set(i for i in data)

是以下的简写：

x = set((i for i in data))

这将创建一个延迟计算的生成器表达式。与以下相比：

x = set([i for i in data])

这会在将其传递给set之前创建一个完整的列表

从性能的角度来看，生成器表达式允许在某些函数中短路（all和any想到），并且占用更少的内存，因为您不需要存储额外的列表 - 在某些情况下，这可能非常重要。

如果你真的要迭代整个可迭代data，并且内存对你来说不是问题，我发现通常列表理解比等效的生成器表达式*略快。

temp $ python -m timeit 'set(i for i in "xyzzfoobarbaz")'
100000 loops, best of 3: 3.55 usec per loop
temp $ python -m timeit 'set([i for i in "xyzzfoobarbaz"])'
100000 loops, best of 3: 3.42 usec per loop

请注意，如果您对速度感到好奇 - 您的最快赌注可能只是：

x = set(data)

证明：

temp $ python -m timeit 'set("xyzzfoobarbaz")'
1000000 loops, best of 3: 1.83 usec per loop

*仅限Cpython - 我不知道Jython或pypy如何优化这些东西。

[]语法创建一个列表，该列表在创建集合后立即丢弃。因此，您正在增加程序的内存占用。

生成器语法避免了这种情况。

相关内容

最新更新

热门标签：