GPU 中的内存绑定内核和计算绑定内核



什么是"GPU 中的内存绑定内核和计算绑定内核"

这与 GPU 的性能有关吗?

非正式地说,如果内核的大部分时间都花在执行内存指令上,则内核是内存绑定的。相反,如果大多数操作是 ALU-FPU 指令,则内核是受计算约束的。GPU 具有高内存和计算带宽,适用于这两个类别。这些术语用于分类,并指示哪些优化技术可以显着提高应用程序的性能。

每个类别的工作负载都有不同的优化提示。

例如,对于内存受限的工作负载:

  • 利用共享内存
  • 内存访问合并
  • 记忆露营。

对于计算密集型工作负载:

  • 减少分支分化
  • ALU-FPU 和旧金山大学
  • 提供足够的独立指令来利用 ILP。

最新更新