cuda: reduce的sdk示例中的有效带宽



在reduction.pdf中,它通过7步介绍了约简方法,有16777216个元素,在第1步中,有效带宽是2.083GB/S, 2.083GB/S是怎么出来的?第2步带宽4.854GB/s是怎么出来的?

带宽数字是使用在缩减输入数据中的字节数除以执行时间(注意有2^22个整数= 16777216字节)来计算的。在reduction/doc的SDK中附带的pdf的第10页上清楚地显示了该计算。

最新更新