随着3.5及以上CUDA架构中动态并行性的出现,是否有可能从__device__
函数中调用线性代数库?
CUDA 7中的CUSOLVER库可以从内核(__global__
)函数调用吗?
CUBLAS库函数可以从设备代码中调用。
推力算法可以从设备代码中调用。
各种CURAND函数可以从设备代码中调用。
其他库是CUDA工具包的一部分,在这个时候(即CUDA 7)——CUFFT, CUSPARSE, CUSOLVER——只能从主机代码中使用。