GPU计数器可以透明地读取到应用程序代码吗?



我正在尝试在GTX 650上执行CUDA rodinia基准测试。我使用代码/usr/local/cuda-5.0/extras/CUPTI/samples/event_sampling来读取指令执行计数器。很奇怪,我没有看到……有任何变化我是否正在执行CUDA基准测试

event_sampling代码也有一些自己的计算,用来衡量执行的指令。与CPU不同,我是否需要对应用程序的源代码进行更改,以便能够读取GPU计数器(如instruction_performed) ?

CUPTI将只提供同一进程中内核的计数器更新。您可以使用NVIDIA可视化分析器或相关环境变量获得其中的一些值,尽管精度不同,但无需修改代码。

相关内容

最新更新