使用 OpenMP 在 Matlab 的 Mex 函数 (Fortran) 中并行化循环



我在Matlab的Mex函数(用Fortran编写(中有一个do循环,它为FEM网格的每个元素执行一些计算。我的网格由250k个元素组成,所以我认为它值得并行化。这是我第一次尝试用OpenMP并行化这段代码(我是一个编程初学者(。我使用了reduction命令来避免fintk(dofele) = fintk(dofele) + fintele中的竞争条件。这是正确的吗?我可以在Matlab中编译它,没有任何问题。然而,当我(在Matlab中(使用它时,它为12k单元网格生成了正确的结果,而且它比串行化的更快,但当我尝试将它用于250k单元网格时,Matlab崩溃了。谢谢你帮我

subroutine loop_over_elements( &
! OUT  
fintk,Sxyz,&
! IN                    
Elem,Bemesh,Dofelemat,u,dt,NE,NDOF)
use omp_lib

implicit none

mwSize NE, NDOF, ele
integer,  parameter   :: dp = selected_real_kind(15,307)
real(dp) :: fintk(NDOF), Sxyz(6,NE), Elemat(4,NE), Bemesh(6,12,NE), Dofelemat(12,NE)
real(dp) :: u(NDOF)  

real(dp) :: Bele(6,12), fintele(12), uele(12), si(6), dt
integer*4  :: nodes(4), dofele(12) 

fintk = 0.D0

!$OMP PARALLEL DO REDUCTION(+:fintk(:)) PRIVATE(ele,nodes,Bele,dofele,uele,si,fintele) 
DO ele = 1, NE 
nodes   = Elemat(1:4,ele)
Bele    = Bemesh(1:6,1:12,ele)
dofele  = Dofelemat(1:12,ele)
uele    = u(dofele)

call comput_subroutine( &
!       IN
Bele,uele,dt, &
!       OUT                                        
si) 

Sxyz(:,ele)   = si
fintele       = MATMUL(TRANSPOSE(Bele),si)
fintk(dofele) = fintk(dofele) + fintele

END DO
!$OMP END PARALLEL DO
return
end

我解决了"崩溃";在调用loop_over_elements子程序之前,通过在通用mexFunction子程序中添加这一行,我体验到了Matlab:call KMP_SET_STACKSIZE(100000000)。我想,当我使用带有非并行子程序的大型模型时,Matlab并没有崩溃,也许这是内存问题。在那之后,我发现了在使用大型数组的OpenMp时众所周知的(不幸的是,对我来说并不是这样(分割错误问题(例如,请参阅(。我仍然有点困惑设置OMP_STACKSIZE(我不知道如何在Mex函数中执行(和KMP_SET_STACKSIZE之间的区别,但现在并行化的代码可以用于大型模型。

最新更新