CUDA -指定最佳网格尺寸

  • 本文关键字:网格 最佳 -指 CUDA cuda
  • 更新时间 :
  • 英文 :


我理解,当指定一个线程块时,建议创建它的线程数等于32的某个倍数,因为经纱大小是32。那么,是否还建议将网格尺寸指定为32的倍数?

网格以块为单位进行处理。对于块的数量,没有特别的依赖于32——所有的块都是相互独立的。

如果可能的话,通常建议至少有足够的块来饱和GPU。这里的经验法则有点模糊,但在GPU中为每个SM至少射击4-8个块通常是一个很好的起点。小于此值的问题可能不会使GPU饱和

最新更新