如何在具有计算能力 7.x 的 CUDA 应用程序中进行分析?指标"dram_read_throughput"在 Nsight 计算中有效吗?



我的设置环境:CUDA 10.2设备:RTX 2080操作系统:Ubuntu 16.04当我尝试使用nvprof时,我发现它不支持具有7.2及更高计算能力的设备。建议我使用Nsight Compute或Nsight Systems。但由于缺乏图形界面,我无法启动上述两个软件。如何在远程服务器中使用Nsight Compute?顺便问一下,是否可以在Nsight Compute中评测度量?

如何在具有计算能力7.x的CUDA应用程序中进行评测?

对于计算能力7.5及更高版本,建议使用nsight计算和nsight系统。nsight计算的文档在这里,nsight系统的文档在那里。有一个介绍性的博客描述了这些";新的";这里是CUDA探查器工具,这里是nsight系统的教程博客,这里是ensight计算的教程博客。介绍性博客描述了为什么有两个工具,以及它们之间的关系。

度量"dram_read_throughput"在Nsight Compute中有效吗?

不是。该度量的命名格式表示它是nvprof度量。nvprof度量名称通常不能直接在Nsight Compute中使用。为了查明是否存在";等效";nsight计算中的度量对于给定的nvprof度量,请使用nvprof转换指南,特别是度量比较表。通过研究该表,您会注意到有一个Nsight计算度量相当于dram_read_throughput,它被命名为dram__bytes_read.sum.per_second。有关如何在Nsight计算中捕获该度量的说明,请参阅我在这里提到的博客,或参阅这里的文档。

但由于缺乏图形界面,我无法启动上述两个软件。如何在远程服务器中使用Nsight Compute?

如果在远程服务器上安装了CUDA工具包,则应该能够在CLI(命令行界面(模式下运行Nsight Compute。这在已经链接的文档和已经链接的博客文章中都有描述。或者,您可以在远程模式下运行GUI,如下所述。

顺便问一下,是否可以在Nsight Compute中评测指标?

是的,我们已经介绍过了。

我将无法使用此问题/答案来调试远程连接详细信息或任何其他关于Nsight工具的特定访问情况或使用场景的后续问题。已有文档和教程。如果您还有其他具体问题,请提出新的问题。要查找Nsight Compute和Nsight Systems的资源,我建议简单地在谷歌上搜索这些名称。通常,最先点击的是这里和这里的登录页,链接到上面的所有资源,以及其他资源,如描述特定案例和高级用法的视频教程。

所有这些工具都可以在windows上使用,也可以使用类似的用户界面。此外,这些工具可以/应该用于计算能力7.0或更高的任何GPU。

相关内容

  • 没有找到相关文章

最新更新