我有以下代码:
#pragma omp parallel shared(a,n) private(i,j,k,x,pid,rows,mymin,mymax)
{
// nprocs=1;
#ifdef _OPENMP
nprocs=omp_get_num_threads();
#endif
#ifdef _OPENMP
pid=omp_get_thread_num();
#endif
rows=n/nprocs;
mymin=pid * rows;
mymax=mymin + rows - 1;
for(k=0;k<n;k++){
if(k>=mymin && k<=mymax){
#pragma omp for schedule(static,rows)
for(x=k+1;x<n;x++){
a[k][x]= a[k][x]/a[k][k];
}
#pragma omp barrier
}
}
}
在这里,我选择哪个线程将根据 if 条件更新矩阵的哪一行。例如,如果有两个线程,线程 1 将更新矩阵 'a' 的前两行,线程 2 将更新其他两个。
选择后,我通过在线程 1 和 2(我开始for(x=k+1,x<n;x++)
(之间平行内部循环来划分该行列的迭代。我还在内部 for 循环之后设置了一个屏障,以便在更新单行的每个列值后,它都会同步。
但问题是我没有获得正确的同步值。在最终矩阵中,线程 0 更新的某些值显示在某些行中,而其他线程更新的某些值显示,但不是全部。
在这里使用 omp barrier
是没有用的,因为除非指定了 nowait
子句,否则在 omp for
构造的末尾存在隐式障碍。
另一方面,您不需要手动指定如何将工作分解为线程,并且分解方式不正确。
实际上,您要尝试执行的操作可以编写如下。
#pragma omp parallel for shared(a,n) private(k,x)
for(k=0;k<n;k++){
for(x=k+1;x<n;x++){
a[k][x]= a[k][x]/a[k][k];
}
}
由于工作负载在不同k
之间不平衡,您可能也希望使用schedule(dynamic, ...)
子句。请参阅 omp 文档以获取更多信息。
http://msdn.microsoft.com/en-us/library/b5b5b6eb.aspx