如何在python中查找"filter"对象的长度


>>> n = [1,2,3,4]
>>> filter(lambda x:x>3,n)
<filter object at 0x0000000002FDBBA8>
>>> len(filter(lambda x:x>3,n))
Traceback (most recent call last):
  File "<pyshell#3>", line 1, in <module>
    len(filter(lambda x:x>3,n))
TypeError: object of type 'filter' has no len()

无法得到我得到的清单的长度。所以我尝试将其保存到一个变量中,就像这样...

>>> l = filter(lambda x:x>3,n)
>>> len(l)
Traceback (most recent call last):
  File "<pyshell#5>", line 1, in <module>
    len(l)
TypeError: object of type 'filter' has no len()

除了使用循环,有没有办法获得它的长度?

您必须以某种方式遍历过滤器对象。一种方法是将其转换为列表:

l = list(filter(lambda x: x > 3, n))
len(l)  # <--

但这可能会首先破坏使用 filter() 的意义,因为您可以通过列表理解更轻松地做到这一点:

l = [x for x in n if x > 3]

同样,len(l)将返回长度。

这是一个古老的问题,但我认为这个问题需要使用map-reduce意识形态来回答。所以在这里:

from functools import reduce
def ilen(iterable):
    return reduce(lambda sum, element: sum + 1, iterable, 0)
ilen(filter(lambda x: x > 3, n))

如果计算机内存中不适合n,这尤其好。

将筛选器转换为列表将占用额外的内存,这对于大量数据可能是不可接受的。您可以找到filter对象的长度,而无需将其转换为list

sum(1 for _ in filter(lambda x: x > 3, n))

一般来说,filterreduce不是pythonic。

@arshajii提出了这个解决方案:

len([x for x in n if x > 3])

这很简单,但并没有描述你到底想做什么,它制作了一个可能使用一些额外内存的列表。更好的解决方案是将sum与生成器一起使用:

sum(1 for x in n if x > 3)

(在此处查看有关生成器的更多信息:https://www.python.org/dev/peps/pep-0289/#rationale)

但是,在大多数情况下,由于实现(在CPython 3.6.4中测试),使用生成器sum实际上更慢:

In [1]: %timeit len([1 for x in range(10000000)])
356 ms ± 17.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [2]: %timeit sum(1 for x in range(10000000))
676 ms ± 7.05 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

python 3 的文档说它返回了一个迭代器

"从那些可迭代的元素构造一个迭代器,这些元素 函数返回 true。

在python 2中,它返回了一个列表:见这里。您需要迭代筛选器对象以查找其长度。

可以使用更多迭代工具求解:

from more_itertools import ilen
f = filter(lambda x:x>3,n)
return ilen(f)

请注意,ilen会消耗过滤器(之后您将无法使用它 - 它将返回一个空列表)

最新更新