Nsys不显示CUDA内核评测输出



我的系统是V100,包含以下信息:

|NVIDIA-SMI 450.80.02驱动程序版本:450.80.02 CUDA版本:11.6|NVIDIA Nsight Systems版本2021.5.2.53-28d0e6e

sudo sh-c"echo 2>/proc/sys/kernel/perf_event_paranoid"/bin/bash:/proc/sys/kernel/perf_event_paranoid:只读文件系统

请注意,perf_event_paranoid为3。

输出:生成时间:/home/build/Baseline.nsys-rep

这是我的命令前缀:

nsys profile --capture-range=cudaProfilerApi --trace-fork-before-exec true --force-overwrite true -s cpu --cudabacktrace=all --stats=true -t cuda,nvtx,osrt,cudnn,cublas -o Baseline -w true

那是我检查nsys状态的时候:

nsys状态-e

支持时间戳计数器:无

采样环境检查

Linux内核偏执狂级别=-1:OK

Linux发行版=Ubuntu

Linux内核版本=5.0.0-1032-azure:OK

Linux perf_event_open系统调用可用:正常

采样触发事件可用:OK

Intel(c(Last Branch Record支持:不可用

采样环境:正常

这是Nsight查看器的输出:(无内核数据(配置文件输出

这就是诊断视图:

诊断视图

我尝试了CUDA 11.0版,这只让Nsight用我的设备驱动程序生成配置文件。Cuda的其他版本没有给我NSight Profiles。

请查看以下帖子以了解更多详细信息:https://forums.developer.nvidia.com/t/nsys-does-not-show-the-kernels-output/229526/17

相关内容

  • 没有找到相关文章

最新更新