使用ncu在统一内存中评测页面故障



是否有任何选项可以使用Nsight Compute(NCU(评测统一虚拟内存CUDA应用程序?例如,我想知道在处理页面错误和迁移上花费的时间。

最后,我自己找到了解决方案。只需指定--export=json即可将评测结果输出到json文件中,即可获得页面故障的详细度量。总体评测命令如下所示。

nsys profile 
--force-overwrite=true 
--cuda-um-gpu-page-faults=true 
--cuda-um-cpu-page-faults=true 
--export=json 
./yourapplication

相关内容

  • 没有找到相关文章

最新更新