什么是"GPU 中的内存绑定内核和计算绑定内核"?
这与 GPU 的性能有关吗?
非正式地说,如果内核的大部分时间都花在执行内存指令上,则内核是内存绑定的。相反,如果大多数操作是 ALU-FPU 指令,则内核是受计算约束的。GPU 具有高内存和计算带宽,适用于这两个类别。这些术语用于分类,并指示哪些优化技术可以显着提高应用程序的性能。
每个类别的工作负载都有不同的优化提示。
例如,对于内存受限的工作负载:
- 利用共享内存
- 内存访问合并
- 记忆露营。
对于计算密集型工作负载:
- 减少分支分化
- ALU-FPU 和旧金山大学
- 提供足够的独立指令来利用 ILP。