使用并行扫描构建堆



我在NVIDIA的网站上读到可以使用CUDA和扫描操作并行构建树。我想知道是否有任何文档解释如何使用扫描操作并行构建堆。任何包含此代码的文档都很棒。我在GPU内存上有一些值,我需要从中返回前k个值。我想并行构建一个堆并返回前k个结果将是一个好主意。

或者,如果没有这样的文档,我想知道是否有任何文档解释如何使用scan并行构建树。

Sean Baxter在这里讨论订单统计信息:

http://www.moderngpu.com/select/mgpuselect.html

尽管他的函数实现了第k个元素的选择,而不是前k个元素的计算。

他的网站也广泛报道了Scan.

最新更新