我正在运行以下代码:
cuCtxCreate(&context, CU_CTX_SCHED_YIELD, device);
int driverVersion = -1;
int driverVersionRt = -1;
int rtVersion = -1;
unsigned int ctxVersion = 1;
cuDriverGetVersion(&driverVersion);
cudaDriverGetVersion(&driverVersionRt);
cudaRuntimeGetVersion(&rtVersion);
cuCtxGetApiVersion(context, &ctxVersion);
std::cout << "cuDriverGetVersion: " << driverVersion << std::endl;
std::cout << "cudaDriverGetVersion: " << driverVersionRt << std::endl;
std::cout << "cudaRuntimeGetVersion: " << rtVersion << std::endl;
std::cout << "cuCtxGetApiVersion: " << ctxVersion << std::endl;
这是输出:
cuDriverGetVersion: 10010
cudaDriverGetVersion: 10010
cudaRuntimeGetVersion: 10000
cuCtxGetApiVersion: 3020
从文档中,我可以看到cudaDriverGetVersion
、cuDriverGetVersion
和cudaRuntimeGetVersion
返回形式的值(1000 * 主要 + 10 * 次要)。该文档没有指定cuCtxGetApiVersion
应该返回什么,但我认为它应该与其他三个函数相同。
我的问题是,为什么上下文的版本号是 3020,而所有其他上下文都使用 10000 和 10010?这是应该的吗?
我遇到了另一个问题,即我创建的新线程需要手动共享其上下文,否则我会收到 201(无效上下文)错误。这很奇怪,因为我知道过去的 CUDA 4.0 所有进程每个进程的每个设备都有一个上下文。因此,我不必为在同一进程中创建的新线程设置上下文。由于cuCtxGetApiVersion
正在生成 3020,这让我相信我创建的上下文使用的是旧的错误版本,该版本不具有跨线程共享的功能。
有这种可能吗?
事实证明,cuCtxGetApiVersion 工作正常。
这个答案帮助我理解了发生了什么。我的cuCtxGetApiVersion使用的是"v2"。上下文版本是最新的,即使它看起来很旧。
至于我的第二个问题,我发现我得到的行为是意料之中的。以前我传递流来执行异步调用,但我玩过没有指定流的同步调用。创建的新线程将没有与之关联的上下文。