GK110的Hyper-Q如何实现多个流的并发性?



如果我想从Kepler GK110的Hyper-Q机制中受益,即将两个流放入两个不同的硬件工作队列中,以避免一些错误的依赖关系,我是否有必要创建具有两个CPU线程的两个流,或者前面提到的过程将由CUDA驱动程序或其他类似CUDA工作分配器的程序自动执行?

或者我可以通过什么方式证明上述考虑?

至于其他新的CUDA功能(例如,动态并行、混洗操作),Hyper-Q已配备,simpleHyperQ SDK示例和相关文档对此进行了很好的解释和说明。

相关内容

  • 没有找到相关文章

最新更新