我试图在r中做一个广泛的计算。十八个小时过去了,但我的RStudio似乎继续工作。我不确定我是否可以用一种不同的方式来写这个脚本,使它更快。我试图在一个50000 × 350的矩阵上实现一个Crank-Nicolson类型的方法,如下所示:
#defining the discretization of cells
dt<-1
t<-50000
dz<-0.0075
z<-350*dz
#velocity & diffusion
v<-2/(24*60*60)
D<-0.02475/(24*60*60)
#make the big matrix (all filled with zeros)
m <- as.data.frame(matrix(0, t/dt+1, z/dz+2)) #extra columns/rows for boundary conditions
#fill the first and last columns with constant boundary values
m[,1]<-400
m[,length(m)]<-0
#implement the calculation
for(j in 2:(length(m[1,])-1)){
for(i in 2:length(m[[1]])){
m[i,][2:length(m)-1][[j]]<-m[i-1,][[j]]+
D*dt*(m[i-1,][[j+1]]-2*m[i-1,][[j]]+m[i-1,][[j-1]])/(dz^2)-
v*dt*(m[i-1,][[j+1]]-m[i-1,][[j-1]])/(2*dz)
}}
有没有办法知道R实现它需要多长时间?有没有更好的方法来构造数值计算?在这一点上,我觉得excel可以更快!!
只是做一些简单的优化确实有帮助。你的代码的原始版本代码在我的笔记本电脑上需要5天左右。使用矩阵并计算循环中重复使用的一次值,我们将其降低到大约7分钟
想想像
这样杂乱的结构m[i,][2:length(m)-1][[j]]
相当于
m[[i, j]]
会更快(也更容易理解)。进行此更改进一步将运行时间减少了2倍以上,约为3分钟
把这些放在一起,我们有
dt<-1
t<-50000
dz<-0.0075
z<-350*dz
#velocity & diffusion
v<-2/(24*60*60)
D<-0.02475/(24*60*60)
#make the big matrix (all filled with zeros)
m <- (matrix(0, t/dt+1, z/dz+2)) #extra columns/rows for boundary conditions
# cache a few values that get reused many times
NC = NCOL(m)
NR = NROW(m)
C1 = D*dt / dz^2
C2 = v*dt / (2*dz)
#fill the first and last columns with constant boundary values
m[,1]<-400
m[,NC]<-0
#implement the calculation
for(j in 2:(NC-1)){
for(i in 2:NR){
ma = m[i-1,]
ma.1 = ma[[j+1]]
ma.2 = ma[[j-1]]
m[[i,j]] <- ma[[j]] + C1*(ma.1 - 2*ma[[j]] + ma.2) - C2*(ma.1 - ma.2)
}
}
如果你需要比这更快,你可以尝试一些更多的优化。例如,请参阅此处了解对同一元素进行索引的不同方式如何导致不同的执行时间。一般来说,最好先引用列,然后再引用行。
如果你可以在R中做的所有优化都不足以满足你的速度要求,那么你可以在RCpp中实现循环。