我的系统是V100,包含以下信息:
|NVIDIA-SMI 450.80.02驱动程序版本:450.80.02 CUDA版本:11.6|NVIDIA Nsight Systems版本2021.5.2.53-28d0e6e
sudo sh-c"echo 2>/proc/sys/kernel/perf_event_paranoid"/bin/bash:/proc/sys/kernel/perf_event_paranoid:只读文件系统
请注意,perf_event_paranoid为3。
输出:生成时间:/home/build/Baseline.nsys-rep
这是我的命令前缀:
nsys profile --capture-range=cudaProfilerApi --trace-fork-before-exec true --force-overwrite true -s cpu --cudabacktrace=all --stats=true -t cuda,nvtx,osrt,cudnn,cublas -o Baseline -w true
那是我检查nsys状态的时候:
nsys状态-e
支持时间戳计数器:无
采样环境检查
Linux内核偏执狂级别=-1:OK
Linux发行版=Ubuntu
Linux内核版本=5.0.0-1032-azure:OK
Linux perf_event_open系统调用可用:正常
采样触发事件可用:OK
Intel(c(Last Branch Record支持:不可用
采样环境:正常
这是Nsight查看器的输出:(无内核数据(配置文件输出
这就是诊断视图:
诊断视图
我尝试了CUDA 11.0版,这只让Nsight用我的设备驱动程序生成配置文件。Cuda的其他版本没有给我NSight Profiles。
请查看以下帖子以了解更多详细信息:https://forums.developer.nvidia.com/t/nsys-does-not-show-the-kernels-output/229526/17