CUDA - GB/s 用于 PCI-E 与 Gbps 用于 GPU 的内存时钟速度



我对PCI-E 3.0速度感到震惊:~16 GB/s(每秒千兆字节(与顶级伽马GPU的内存时钟速度(Titan X列出~10 Gbps,即每秒千兆位(

所以我们有

PCI-E 3.0    16 GB/s
Titan X      ~1 GB/s

所以问题是:为什么会有这种深渊的差异?关于CUDA,他们经常说PCI-E是利用GPU功能的最大障碍,但似乎恰恰相反:PCI-E可以处理比GPU内存更大的负载(甚至PCI-E也是~8 GB/s(

我的推理是否存在某种缺陷?

TITAN X 的 10 Gb/s 内存带宽值是每个引脚的。对于 384 位宽的内存接口,这相当于 480 GB/秒的总理论峰值内存带宽。实际可实现的值约为内存和 PCIe 理论峰值带宽的 80%。

最新更新