我实现了小的统计函数,并通过多处理并行化。代码的整体结构如下所示:
def worker(args, no):
f = Stat.fit(args)
return f.result
class Stat:
def fit(self):
doing various things...
def bootstrap(self):
p = mp.Pool(mp.cpu_count())
parameter = ... #set parameters for Stat
worker = functools.partial(worker, parameter)
for i, _ in enumerate(p.imap_unordered(worker, range(1000))):
pass
因此,Stat类中的bootstrap方法调用运行函数的进程,该函数创建Stat类实例并运行fit()方法。我想这种方法可能效率很低。用函数代替类更好吗?或者使用这样的类不会影响多处理性能?
这不是低效的(它不会影响性能),它只是不正统。如果你把bootstrap
从Stat
中去掉,它可能会更简洁一些,因为它看起来并没有从该类的方法中获益。
def worker(args, no):
f = Stat.fit(args)
return f.result
def bootstrap(self):
p = mp.Pool(mp.cpu_count())
parameter = ... #set parameters for Stat
worker = functools.partial(worker, parameter)
for i, _ in enumerate(p.imap_unordered(worker, range(1000))):
pass
class Stat:
def fit(self):
doing various things...