小贝子编程

在与 CUDA 的互操作区域内使用 openACC 指令

本文关键字：openACC 指令区域 CUDA 互操作在与 gpu openacc cufft
更新时间 : 2023-09-12
英文 : using openACC directive inside interoperation region with CUDA

有什么方法可以在以下计算区域中进一步并行化循环，替换 PGI 18.1 包含 #pragma ACC 循环指令

#pragma acc host_data use_device(ptr)
    {
     cufftPlanMany( &plan, rank, ss  , &inembed, istride, idist, &onembed, ostride, odist, CUFFT_Z2Z, F.length[0]);
    // this loop
    for(int i=0;i<length[2];i++)
    {
     cufftExecZ2Z( plan, (cufftDoubleComplex *)(ptr+i*length[0]*length[1]), (cufftDoubleComplex *)(ptr+i*length[0]*length[1]), CUFFT_INVERSE );
    }
     cufftDestroy(plan);
    }

库达计划许多人已经解决了这个问题吗？

我认为

，假设 cufft 使用了 GPU 的全部计算能力，进一步并行化甚至可能没有意义，

最新更新

对于大一点的孩子(9岁以上的孩子)，我需要什么样的iOS家长门?
Understanding std::vector::push_back(std::move(v[i]))
你能找到解决这个问题的方法吗?
在使用相同group_id的kafka消费者中使用assign而不是subscribe是否有影响? &
让谷歌的见解清楚地表明，我的网站上有不止一个页面
我无法在反应中删除 html 标签
获取/读取邮件消息并输出纯文本
显示:表格单元格与行号不对齐
如何使用Toga应用访问Android通知
访问create_template_view api时出现INVALID_REQUEST_BODY错误
使用预处理器条件生成C/ c++变量名
此处映射计算路线API上的错误414
Oracle数据库中的并行提示
woocommerce在每个类别结帐后自定义重定向
是否有可能在AWS中设置一个webhook来监控特定的电子邮件地址，并将接收到的电子邮件信息传递给Lambda?<
仅使用numpy实现CNN时出错
过程展开不规则时间序列
插入多个带别名的外键
如何从API响应中提取Array
WebLogic 14c -性能调优测试
Google-Drive-API文件没有使用FORM_ID找到
尝试创建一个伸缩盒容器，但它不会创建盒子并显示文本
是否有一种方法(最好是R)从BirdLife数据区自动提取信息?
为什么process.env.JWT_EXPIRE未被发现?js筑巢
Python记录器没有从根记录器继承level
是什么导致了python的f字符串中"f "{a}""与"f "{a=}""之间的差异？
标题库使用介子
打印偶数的"count"，而循环使用 if
为什么我要将数组转换为对象
通过共享操作符将可连接的Flux转换为Hot不工作

在与 CUDA 的互操作区域内使用 openACC 指令

相关内容

最新更新

热门标签：