计数并行函数调用 python



我有一个问题,我需要并行调用一个类的实例函数并计算它被调用的次数,以便每次调用都有一个唯一的标识符(用于将结果存储在唯一位置(。

这是一个问题,其中包含我想要的解决方案,但在 Java 中

下面是一个最小示例:

para2.py,它设置了所有实例方法酸洗的东西(不太相关(:

from copy_reg import pickle
from types import MethodType
from para import func
def _pickle_method(method):
    return _unpickle_method, (method.im_func.__name__, method.im_self, method.im_class)
def _unpickle_method(func_name, obj, cls):
    return cls.__dict__[func_name].__get__(obj, cls)
pickle(MethodType, _pickle_method, _unpickle_method)
func()

现在 para.py 包含:

from sklearn.externals.joblib import Parallel, delayed
from math import sqrt
from multiprocessing import Lock
class Thing(object):
    COUNT = 0
    lock = Lock()
    def objFn(self, x):
        with Thing.lock:
            mecount = Thing.COUNT
            Thing.COUNT += 1
        print mecount
        n=0
        while n < 10000000:# add a little delay for consistency
            n += 1
        return sqrt(x)
def func()
    thing = Thing()
    y = Parallel(n_jobs=4)(delayed(thing.objFn)(i**2) for i in range(10))
    print y

现在在终端打印中运行python para2.py

0
0
0
0
1
1
1
1
2
2
[0.0, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0]

我需要垂直上的这些数字来计数 0 到 9,但似乎所有四个进程仍在访问并尝试同时更新COUNT。我怎样才能让它做我想做的事?

通过多处理,python 会分叉您的代码并创建一个运行代码的子进程。 在此过程中,它会为每个子进程创建类的副本。 它不共享代码/数据。 您可以通过放置打印注释来对此进行调试,例如...

print multiprocessing.current_process().name

在您的构造函数和objFn中,以查看什么在哪里运行以及它的价值是什么。

为了在进程之间共享数据,您必须从multiprocessing库中为此设计一些东西。 这些是Value and Array对象。 它们使用共享内存,因此通常仅限于积分ctypes,而不仅仅是任何通用的python对象。

最新更新