与Pool并行运行emcee时的步骤相同



我使用emcee在Python中运行一个MCMC进程。我的python代码是一个不同软件的包装器。CCD_ 2步行者对该软件的输入参数空间进行采样。该软件读取一个文本文件作为其输入。我的代码使用emcee链的每一步生成这个文本文件。为了加快采样速度,我希望多个进程并行运行,以评估日志可能性。但是,这些进程中的每一个都需要写入不同的输入文本文件,以防止进程之间的干扰。出于这个原因,我想我不能在主持人网站上使用简单的标准示例。

理想情况下,我希望每个进程都在自己的子目录中运行,生成不同的输入文件,这样不同的进程就不会相互干扰。为此,我使用multiprocessing中的Pool手动创建并行进程,而不是使用emcee中的默认选项。我知道,为了使不同的并行过程生成不同的随机数,我需要为每个PRNG提供不同的种子。我当前的代码如下:

def log_likelihood(x):
#update input text file and run software
return log_likelihood
def run_mcmc(inp_directory)
os.chdir(inp_directory)
seedint = int(dusty_inpdir.split('_')[-1]) #sets a different seed for each process
np.random.seed(seedint)
sampler = emcee.EnsembleSampler(nwalkers, ndim, log_likelihood)
sampler.run_mcmc(initial_pos,ntrials)
pool = Pool()
inp_dirlist = ['proc_0','proc_1','proc_2','proc_3']
pool.map(run_mcmc,inp_dirlist)

尽管每个过程都有不同的种子,但所有4个过程都会生成完全相同的emcee步骤集。

np.random.seed不是为emceePRNG设定种子的相关参数吗?有没有更好的方法让不同的进程在不同的目录中工作?

使用np.random.seed设置numpy随机数生成器的全局状态。要让每个主持人采样器都有不同的种子,您应该使用seed参数:

sampler = emcee.EnsembleSampler(nwalkers, ndim, log_likelihood, seed=seedint)

相关内容

  • 没有找到相关文章

最新更新