我们可以将 "normal" GPU 内存复制到"unified"内存吗？

我们有两个GPU内存，一个分配cuMalloc作为普通设备内存，另一个分配cuMallocManaged作为统一内存。是否可以在它们之间复制？如果我们使用驱动程序 API，我应该使用什么方向？

float* normalMem, unifiedMem;
cuMalloc(&normalMem, 100);
cuMallocManaged(&unifiedMem, 100);
cuMemcpyD2D(unifiedMem, normalMem, 100); // ? D2D? or D2H? or else?

是的，你可以。例如，查看以下代码。

它声明了一个普通指针、一个托管指针和一个主机指针，它们都是 100float。
它初始化主机指针中的值，然后使用 cudaMemCpy 将值复制到普通指针。
现在，值已复制到托管指针
托管指针在内核中用于显示已从两个缓冲区复制的值。

我认为代码是不言自明

的

__global__ 
void test(float* d_ptr){
for(int i=0;i<100;i++)
printf("%f n",d_ptr[i]);
printf("n");
}
////////////////////////////////////////////////////////////////////////////////
// Program main
////////////////////////////////////////////////////////////////////////////////
int main(int argc, char **argv)
{
size_t size = sizeof(float)*100;
float* h_p =(float*) malloc(size);
float* d_p, dm_p ; 
cudaMalloc(&d_p,size);
cudaMallocManaged(&dm_p,size);
for(int i=0;i<100;i++)
h_p[i]=2*(float)i;
cudaMemcpy(d_p,h_p,size,cudaMemcpyHostToDevice);
cudaDeviceSynchronize();
cudaMemcpy(dm_p,d_p,size,cudaMemcpyDeviceToDevice);
cudaDeviceSynchronize();
test<<<1,1>>>(dm_p);
cudaDeviceSynchronize();
cudaFree(dm_p);
cudaFree(d_p);
free(h_p);
return 0;
}

请记住阅读统一内存访问规则。

相关内容

最新更新

热门标签：