我发现了这篇文章,但我仍然不清楚redzone_checker
内核在做什么以及为什么。具体来说,它是否应该服用>应用程序运行时的90% ?TensorBoard报告说它占用了我的JAX代码的绝大部分运行时,我想知道
- 实际上是这个内核占用了太多的时间,还是这是用TensorBoard分析JAX的副作用(即,输出在某种程度上是误导的)?
- 是否有一种方法可以减少
redzone_checker
内核所花费的时间?这是个好主意吗?
提前感谢您的建议。
在分析前确保热身。
可能是jit编译时间。