我想通过 nvproof 生成一个极限配置文件。 如何将分析时间限制在 5 秒?
nvprof有一个timeout
选项。从文档:
可以为 nvprof 提供超时(以秒为单位(。库达应用程序 被分析将在超时后被 NVPROF 杀死。分析 将显示在超时之前收集的结果。
注意:超时从 CUDA 驱动程序的那一刻开始计算 初始 化。如果应用程序未调用任何 CUDA API,则超时 不会被触发。
您还可以标记 nvprof 应应用于的时间起点和终点。这可以使用cudaProfilerStart()
和cudaProfilerEnd()
显式完成,或者以隐式的 RAII 方式使用cuda::profiling::scope
对象的生命周期(来自我的现代 C++ CUDA API 包装器(。
请记住,如果您使用 nvvp,请不要选中告诉它分析整个运行的框。