我在Matlab的Mex函数(用Fortran编写(中有一个do
循环,它为FEM网格的每个元素执行一些计算。我的网格由250k个元素组成,所以我认为它值得并行化。这是我第一次尝试用OpenMP并行化这段代码(我是一个编程初学者(。我使用了reduction
命令来避免fintk(dofele) = fintk(dofele) + fintele
中的竞争条件。这是正确的吗?我可以在Matlab中编译它,没有任何问题。然而,当我(在Matlab中(使用它时,它为12k单元网格生成了正确的结果,而且它比串行化的更快,但当我尝试将它用于250k单元网格时,Matlab崩溃了。谢谢你帮我
subroutine loop_over_elements( &
! OUT
fintk,Sxyz,&
! IN
Elem,Bemesh,Dofelemat,u,dt,NE,NDOF)
use omp_lib
implicit none
mwSize NE, NDOF, ele
integer, parameter :: dp = selected_real_kind(15,307)
real(dp) :: fintk(NDOF), Sxyz(6,NE), Elemat(4,NE), Bemesh(6,12,NE), Dofelemat(12,NE)
real(dp) :: u(NDOF)
real(dp) :: Bele(6,12), fintele(12), uele(12), si(6), dt
integer*4 :: nodes(4), dofele(12)
fintk = 0.D0
!$OMP PARALLEL DO REDUCTION(+:fintk(:)) PRIVATE(ele,nodes,Bele,dofele,uele,si,fintele)
DO ele = 1, NE
nodes = Elemat(1:4,ele)
Bele = Bemesh(1:6,1:12,ele)
dofele = Dofelemat(1:12,ele)
uele = u(dofele)
call comput_subroutine( &
! IN
Bele,uele,dt, &
! OUT
si)
Sxyz(:,ele) = si
fintele = MATMUL(TRANSPOSE(Bele),si)
fintk(dofele) = fintk(dofele) + fintele
END DO
!$OMP END PARALLEL DO
return
end
我解决了"崩溃";在调用loop_over_elements
子程序之前,通过在通用mexFunction
子程序中添加这一行,我体验到了Matlab:call KMP_SET_STACKSIZE(100000000)
。我想,当我使用带有非并行子程序的大型模型时,Matlab并没有崩溃,也许这是内存问题。在那之后,我发现了在使用大型数组的OpenMp时众所周知的(不幸的是,对我来说并不是这样(分割错误问题(例如,请参阅(。我仍然有点困惑设置OMP_STACKSIZE
(我不知道如何在Mex函数中执行(和KMP_SET_STACKSIZE
之间的区别,但现在并行化的代码可以用于大型模型。