如何通过 nvprof 在短时间内分析 CUDA 应用程序?



我想通过 nvproof 生成一个极限配置文件。 如何将分析时间限制在 5 秒?

nvprof有一个timeout选项。从文档:

可以为 nvprof 提供超时(以秒为单位(。库达应用程序 被分析将在超时后被 NVPROF 杀死。分析 将显示在超时之前收集的结果。

注意:超时从 CUDA 驱动程序的那一刻开始计算 初始 化。如果应用程序未调用任何 CUDA API,则超时 不会被触发。

您还可以标记 nvprof 应应用于的时间起点和终点。这可以使用cudaProfilerStart()cudaProfilerEnd()显式完成,或者以隐式的 RAII 方式使用cuda::profiling::scope对象的生命周期(来自我的现代 C++ CUDA API 包装器(。

请记住,如果您使用 nvvp,请不要选中告诉它分析整个运行的框。

最新更新