了
我碰巧有一个库,它已经在内部为我在 OpenCL 中提供了一个 GPU Ptr。
auto* gpuImagePtr = upImpl->upCaffeNet->blobs().at(0)->mutable_gpu_data();
cl::Buffer imageBuffer = cl::Buffer((cl_mem)gpuImagePtr);
我想将数据写入 imageBuffer 指向的指针中,而不分配新内存。我实际上该怎么做?如果我实例化一个 cl::Buffer,它将简单地写入一个新地址。我不想写一个内核来做到这一点。
在 CUDA 中,我会这样做
auto* gpuImagePtr = upImpl->upCaffeNet->blobs().at(0)->mutable_gpu_data();
cudaMemcpy(gpuImagePtr, inputData.getConstPtr(), inputData.getVolume() * sizeof(float),
cudaMemcpyHostToDevice);
在 OpenCL 中,我尝试这样做,但它只是段错误:
auto* gpuImagePtr = upImpl->upCaffeNet->blobs().at(0)->mutable_gpu_data();
cl::Buffer imageBuffer = cl::Buffer((cl_mem)gpuImagePtr);
op::CLManager::getInstance(upImpl->mGpuId)->getQueue().enqueueWriteBuffer(imageBuffer, true, 0, inputData.getVolume() * sizeof(float), inputData.getConstPtr());
好的,事实证明我需要使用保留标志:
cl::Buffer imageBuffer = cl::Buffer((cl_mem)gpuImagePtr, true);
现在它不再崩溃