当我尝试使用nvvp评测pyCUDA应用程序时,它在大多数情况下都能工作。我可以点击"检查GPU使用情况",查看我的代码的许多分析结果/建议,例如"低计算/Mocpy效率"
然而,每次nvvp运行程序执行分析时,我都会看到以下警告。
某些收集的事件、度量或源级别结果无法与会话时间线关联。这可能会阻止将事件、度量和源级别的结果分配给某些内核。
如果我做点什么来解决这个问题,我可能会得到更详细的分析。有人知道如何将"收集的事件、指标或源级别的结果与会话时间线相关联"吗?
正如探查器文档中所示:
◦使用选项--kernels内核筛选器时,Visual Profiler无法正确导入nvprof生成的探查器数据。Visual Profiler报告一条警告,"某些收集的事件或源代码级别的结果无法与会话时间线关联。"一种解决方法是使用nvprof选项--kernels::1来评测所有内核的第一次调用。
因此您可以尝试更改此选项