Python - 调用 numpy.random thread 的函数是否安全



根据这个答案,它不是。但这与我迄今为止观察到的情况并不一致。请考虑以下脚本:

import numpy as np
from multiprocessing.dummy import Pool
from queue import Queue
SIZE=1000000
np.random.seed(1)
tPool = Pool(100)
q1 = Queue()
def worker_thread(i):
    q1.put(np.random.choice(100, 5))
tPool.map(worker_thread, range(SIZE))
q2 = Queue()
np.random.seed(1)
for i in range(SIZE):
    q2.put(np.random.choice(100, 5))
n = 0
for i in range(SIZE):
    n += (q1.get() == (q2.get()))
print(n)

基本上,我在这里测试的是 SIZE 调用数是否会在多线程环境中生成与单线程环境中相同的序列。对我来说,这将输出 n=SIZE。当然,这可能只是偶然,所以我运行了几次并得到了一致的结果。所以我的问题是,调用 numpy.random 包的函数是线程安全的吗?

我已经在我的机器上运行了几次你的脚本,并得到了999995数组,999992几乎和1000000一样频繁(python 3.5.2,numpy 1.13.3)。所以你所指的答案是正确的:np.random可能会在多线程环境中产生不同的结果。

如果您增加池大小,您可以自己看到它,比如说1000,样本大小,比如说50。即使对于较小的SIZE=100000,我也能够实现 100% 的不一致.

最新更新