如果我想从Kepler GK110的Hyper-Q机制中受益,即将两个流放入两个不同的硬件工作队列中,以避免一些错误的依赖关系,我是否有必要创建具有两个CPU线程的两个流,或者前面提到的过程将由CUDA驱动程序或其他类似CUDA工作分配器的程序自动执行?
或者我可以通过什么方式证明上述考虑?
至于其他新的CUDA功能(例如,动态并行、混洗操作),Hyper-Q已配备,simpleHyperQ
SDK示例和相关文档对此进行了很好的解释和说明。