一种盆地跳跃方法的编程和优化代码



所以我正在编程一个盆地,希望从零找到相互作用粒子系统的潜在最小值,到目前为止我已经获得了很好的结果,但是因为我增加了系统的粒子数量,代码需要更多的时间来运行。我用共轭梯度来求局部最小值。我没有得到任何错误信息,程序似乎工作得很好,但我想知道如何优化代码,以减少计算时间。

我将盆地跳跃定义为一个函数,给定:

def bhmet(n,itmax, pot,derpot, T):
i = 1 
phi = np.random.rand(n)*2*np.pi
theta = np.random.rand(n)*np.pi
x = 3*np.sin(theta)*np.cos(phi)
y = 3*np.sin(theta)*np.sin(phi)
z = 3*np.cos(theta)
xyzat = np.hstack((x,y,z))
vmintot = 0 
while i <= itmax: 
print(i)   
plmin = optimize.fmin_cg(pot,xyzat,derpot,gtol = 1e-5,) #posiciones para el mínimo local.4
if pot(plmin) < vmintot or np.exp((1/T)*(vmintot-pot(plmin))) > np.random.rand():
vmintot = pot(plmin)
xyzat = plmin + 2*0.3*(np.random.rand(len(plmin))-0.5)
i = i + 1  
return plmin,vmintot 

我尝试将初始条件(第一个'xyzat')定义为矩阵,但scipy.optimize的参数。fmin_cg被请求作为一个数组(这就是为什么在函数中我将重塑数组作为一个矩阵)。

我正在搜索全局最小值的函数是:

def ljpot(posiciones,):
r = np.array([])
matpos = np.zeros((int((1/3)*len(posiciones)),3))
matpos[:,0] = posiciones[0:int((1/3)*len(posiciones))]
matpos[:,1] = posiciones[int((1/3)*len(posiciones)):int((2/3)*len(posiciones))]
matpos[:,2] = posiciones[int((2/3)*len(posiciones)):]    
for j in range(0,np.shape(matpos)[0]):
for k in range(j+1,np.shape(matpos)[0]):
ri = np.sqrt(sum((matpos[k,:]-matpos[j,:])**2))
r = np.append(r,ri) 
V = 4*((1/r)**12-(1/r)**6)
vt = sum(V)
return vt

它的梯度是:

def gradpot(posiciones,):
gradv = np.array([])
matposg = np.zeros((int((1/3)*len(posiciones)),3))
matposg[:,0] = posiciones[:int((1/3)*len(posiciones))]
matposg[:,1] = posiciones[int((1/3)*len(posiciones)):int((2/3)*len(posiciones))]
matposg[:,2] = posiciones[int((2/3)*len(posiciones)):]   
for w in range(0,np.shape(matposg)[1]): #índice que cambia de columna. 
for k in range(0,np.shape(matposg)[0]): #índice que cambia de fila.
rkj = np.array([])
xkj = np.array([])
for j in range(0,np.shape(matposg)[0]): #también este cambia de fila. 
if j != k:
r = np.sqrt(sum((matposg[j,:]-matposg[k,:])**2))
rkj = np.append(rkj,r) 
xkj = np.append(xkj,matposg[j,w])
dEdxj = sum(4*(6*(1/rkj)**8- 12*(1/rkj)**14)*(matposg[k,w]-xkj))
gradv = np.append(gradv,dEdxj)
return gradv

我将数组输入转换成矩阵的原因是,对于每个粒子,有三个坐标x,y,z所以矩阵的列是每个粒子的x,y,z。我尝试使用np.重塑()来做这件事,但是对于程序已经得到正确结果的系统,它似乎给了我错误的结果。

代码似乎运行良好,但随着粒子数量的增加,运行时间呈指数增长。我知道全局优化可能会花费很长时间,但也许我对代码做了一些改动。我不知道减少运行时间的方法是否很明显,我对优化代码有点陌生,所以如果是这样的话,我很抱歉。当然,欢迎任何建议。非常感谢大家!

在快速浏览之后,我注意到两件事,这绝对可以节省一些时间。这两种方法在之前都需要更多的思考,但之后你将获得优化和更清晰的代码。


1。尽量避免使用append.append效率非常低。您从一个空数组开始,然后每次都需要分配更多的内存。这会导致低效的内存处理,因为每次追加一个数字时都要复制数组。阵列越长,append的效率越低。

选择:使用np.zeros((m,n))来初始化数组,mn是它最终的大小。然后需要一个计数器,将新值放在相应的位置。如果在计算之前没有定义数组的大小,您可以将其初始化为一个大数字,然后将其切割。


2。尽量避免使用for循环。它们通常非常慢,特别是在迭代大型矩阵时,因为您需要单独索引每个条目。

选择:矩阵运算通常要快得多。例如,您可以先定义两个矩阵AB,它们对应于matposg[j,:]matposg[k,:](不使用循环也可以!),而不是在两个for循环中定义r = np.sqrt(sum((matposg[j,:]-matposg[k,:])**2)),然后简单地使用r = np.linalg.norm(A-B)

最新更新