我试图弄清楚创建一百万ndarray
(numpy 数组)需要多长时间,并将其与list
使用timeit
库所花费的时间进行比较,但我收到以下语法错误:
File "<timeit-src>", line 2
[1 2 3 4 5]
^
SyntaxError: invalid syntax
这个错误是有道理的,但我什至不知道我该怎么做。
以下是我到目前为止尝试的代码
import numpy as np
import timeit
arr = [1, 2, 3, 4, 5]
ndarr = np.array([1, 2, 3, 4, 5])
list_time = timeit.timeit(stmt=f'{arr}', number=1000000)
ndarray_time = timeit.timeit(stmt=f'{ndarr}', number=1000000)
print('list takes', list_time, sep=': ')
print('ndarray takes', ndarray_time, sep=': ')
list
结果是预期的,但ndarray
不是。
您可以传递一个可调用对象:
list_time = timeit.timeit(stmt=lambda: [1, 2, 3, 4, 5], number=1000000)
ndarray_time = timeit.timeit(stmt=lambda: np.array([1, 2, 3, 4, 5]), number=1000000)
#lambda: (ndarr := np.array([1, 2, 3, 4, 5])) - (if actual assignment matters...?)
你也可以传递一个字符串,但正如注释在这里提到的,你需要正确设置它:
list_time = timeit.timeit(stmt="a = [1, 2, 3, 4, 5]", number=1000000)
ndarray_time = timeit.timeit(stmt=lambda: "a = np.array([1, 2, 3, 4, 5])", setup="import numpy as np", number=1000000)
In [628]: arr=[1,2,3,4,5]
In [629]: ndarr=np.array([1,2,3,4,5])
In [630]: f'{arr}'
Out[630]: '[1, 2, 3, 4, 5]'
In [631]: f'{ndarr}'
Out[631]: '[1 2 3 4 5]'
问题是,虽然"[1, 2, 3, 4, 5]"
是可执行表达式,但"[1 2 3 4 5]"
不是。 很难从现有ndarray
创建可执行表达式 - 并非不可能,但您必须努力。
在ipython
会话中,运行这样的 timeit 测试很简单:
In [632]: timeit [1,2,4,5]
60.6 ns ± 1.77 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
In [633]: timeit np.array([1,2,4,5])
2.22 µs ± 20.7 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
repr
更好,看起来更像列表
In [635]: f'{repr(ndarr)}'
Out[635]: 'array([1, 2, 3, 4, 5])'
但即使这样也需要调整才能使array
部分正确。