分析结果未显示在事件/指标摘要模式下 nvprof



根据nvprof的事件/摘要模式的文档,输出如下所示:

==6461== Profiling application: matrixMul 
==6461== Profiling result: 
==6461== Event result: 
//The outputs 
==6461== Metric result: 
//The outputs

默认值应显示 API 调用和内核的延迟、百分比等Profiling result。所以有两个问题:

  1. 为什么没有任何输出在Profiling Result
  2. 如何让nvprof也输出Profiling Result
为什么在

分析结果下没有任何输出?

根据文件,它指出:

nvprof以下面列出的模式之一运行。

这些模式是:

  • 3.1.1 摘要模式(默认)
  • 3.1.2 GPU 跟踪和/或 API 跟踪模式
  • 3.1.3 事件/指标汇总模式
  • 3.1.4 事件/指标跟踪模式

摘录的信息来自3.1.3 事件/指标摘要模式。 当您处于此模式时,您不处于任何其他模式,并且其他模式的数据收集(和输出)描述不适用。

如何让nvprof也输出Profiling Result

如果要基于每个内核捕获指标信息,请使用 3.1.4 事件/指标跟踪模式。 然后,输出将显示在"Profiling Result"部分中。

对于其他组合,无法让nvprof在单次运行中显示分析数据的任意集合。 如果需要仅在特定模式下可用的输出,则需要在该模式下运行才能获得该输出。 可能需要多次运行nvprof才能获取要收集的所有输出信息或数据。nvvp(可视化探查器)执行此操作(即将在后台多次运行nvprof),以便为给定的应用程序视图显示更大范围的数据。

相关内容

  • 没有找到相关文章

最新更新