如何查看创建 100 万个 ndarray 所花费的时间?



我试图弄清楚创建一百万ndarray(numpy 数组)需要多长时间,并将其与list使用timeit库所花费的时间进行比较,但我收到以下语法错误:

File "<timeit-src>", line 2
[1 2 3 4 5]
^
SyntaxError: invalid syntax

这个错误是有道理的,但我什至不知道我该怎么做。

以下是我到目前为止尝试的代码

import numpy as np
import timeit
arr = [1, 2, 3, 4, 5]
ndarr = np.array([1, 2, 3, 4, 5])
list_time = timeit.timeit(stmt=f'{arr}', number=1000000)
ndarray_time = timeit.timeit(stmt=f'{ndarr}', number=1000000)
print('list takes', list_time, sep=': ')
print('ndarray takes', ndarray_time, sep=': ')

list结果是预期的,但ndarray不是。

您可以传递一个可调用对象:

list_time = timeit.timeit(stmt=lambda: [1, 2, 3, 4, 5], number=1000000)
ndarray_time = timeit.timeit(stmt=lambda: np.array([1, 2, 3, 4, 5]), number=1000000)
#lambda: (ndarr := np.array([1, 2, 3, 4, 5])) - (if actual assignment matters...?)

你也可以传递一个字符串,但正如注释在这里提到的,你需要正确设置它:

list_time = timeit.timeit(stmt="a = [1, 2, 3, 4, 5]", number=1000000)
ndarray_time = timeit.timeit(stmt=lambda: "a = np.array([1, 2, 3, 4, 5])", setup="import numpy as np", number=1000000)
In [628]: arr=[1,2,3,4,5]                                                                            
In [629]: ndarr=np.array([1,2,3,4,5])                                                                
In [630]: f'{arr}'                                                                                   
Out[630]: '[1, 2, 3, 4, 5]'
In [631]: f'{ndarr}'                                                                                 
Out[631]: '[1 2 3 4 5]'

问题是,虽然"[1, 2, 3, 4, 5]"是可执行表达式,但"[1 2 3 4 5]"不是。 很难从现有ndarray创建可执行表达式 - 并非不可能,但您必须努力。

ipython会话中,运行这样的 timeit 测试很简单:

In [632]: timeit [1,2,4,5]                                                                           
60.6 ns ± 1.77 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
In [633]: timeit np.array([1,2,4,5])                                                                 
2.22 µs ± 20.7 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

repr更好,看起来更像列表

In [635]: f'{repr(ndarr)}'                                                                           
Out[635]: 'array([1, 2, 3, 4, 5])'

但即使这样也需要调整才能使array部分正确。

最新更新