是否有任何选项可以使用Nsight Compute(NCU(评测统一虚拟内存CUDA应用程序?例如,我想知道在处理页面错误和迁移上花费的时间。
最后,我自己找到了解决方案。只需指定--export=json
即可将评测结果输出到json文件中,即可获得页面故障的详细度量。总体评测命令如下所示。
nsys profile
--force-overwrite=true
--cuda-um-gpu-page-faults=true
--cuda-um-cpu-page-faults=true
--export=json
./yourapplication