CUDA中的线性代数库和动态并行性



随着3.5及以上CUDA架构中动态并行性的出现,是否有可能从__device__函数中调用线性代数库?

CUDA 7中的CUSOLVER库可以从内核(__global__)函数调用吗?

CUBLAS库函数可以从设备代码中调用。

推力算法可以从设备代码中调用。

各种CURAND函数可以从设备代码中调用。

其他库是CUDA工具包的一部分,在这个时候(即CUDA 7)——CUFFT, CUSPARSE, CUSOLVER——只能从主机代码中使用。

最新更新