如何在多处理代码中重用池工作线程?

在下面的代码中，我收到一个关于"无法在模块主上获取属性'f'"的错误。我知道如何解决它：将池线和结果线都放在结果 2 的正上方。

我的问题是为什么当前形式的代码不起作用。我正在使用更复杂的代码，其中我必须在两个不同的独立 for 循环中使用并行处理。现在，我在每个 for 循环的每个迭代中都有，pool=mp。游泳池(3(. 我在网上读到这很糟糕，因为在每次迭代中，我都在创建更多的池"工人"。我怎样才能把池 = mp。Pool(3( 在迭代的外部，然后在我需要的代码的所有不同区域中使用相同的 Pool 工作线程？

作为记录，我正在使用Mac来运行我的代码。

import numpy as np
import multiprocessing as mp
x = np.array([1,2,3,4,5,6])
pool = mp.Pool(3)
def f(x):
return x**2
result = pool.map(f,x)
def g(x):
return x + 1
result2 = pool.map(g,x)
print('result=',result,'and result2=',result2)

当使用"fork"方法创建子进程(Mac OS 默认(时，创建Pool时，进程被分叉(基本上是复制的(。这意味着在您的代码中，分叉子项尚未执行f的创建，而是等待来自主进程的任务。

首先，您不应该直接在脚本中执行"活动"代码(除了定义函数、类、常量(，而应该将其移动到函数中。然后，您的代码可能如下所示：

import numpy as np
import multiprocessing as mp

def f(x):
return x**2
def g(x):
return x + 1
def main():
x = np.array([1,2,3,4,5,6])
pool = mp.Pool(3)
result = pool.map(f,x)
result2 = pool.map(g,x)
print('result=',result,'and result2=',result2)
# Should be nearly the only "active" statement
main()

或者在你的情况下可能更好，我想：

import numpy as np
import multiprocessing as mp

def f(x):
return x**2
def g(x):
return x + 1
def proc_f():
global x, pool
return pool.map(f,x)
def proc_g():
global x, pool
return pool.map(g,x)
def main():
global x, pool
x = np.array([1,2,3,4,5,6])
pool = mp.Pool(3)
result = proc_f()
result2 = proc_g()
print('result=',result,'and result2=',result2)
# Should be nearly the only "active" statement
main()

相关内容

最新更新

热门标签：