如何关联事件、度量和源级别结果,以便使用nvvp分析pyCUDA程序



当我尝试使用nvvp评测pyCUDA应用程序时,它在大多数情况下都能工作。我可以点击"检查GPU使用情况",查看我的代码的许多分析结果/建议,例如"低计算/Mocpy效率"

然而,每次nvvp运行程序执行分析时,我都会看到以下警告。

某些收集的事件、度量或源级别结果无法与会话时间线关联。这可能会阻止将事件、度量和源级别的结果分配给某些内核。

如果我做点什么来解决这个问题,我可能会得到更详细的分析。有人知道如何将"收集的事件、指标或源级别的结果与会话时间线相关联"吗?

正如探查器文档中所示:

◦使用选项--kernels内核筛选器时,Visual Profiler无法正确导入nvprof生成的探查器数据。Visual Profiler报告一条警告,"某些收集的事件或源代码级别的结果无法与会话时间线关联。"一种解决方法是使用nvprof选项--kernels::1来评测所有内核的第一次调用。

因此您可以尝试更改此选项

相关内容

最新更新