对CUDA实现功能的未定义引用



我写了一个main.cpp,其中包含Common.h文件

#include "Common.h"
int main(int argc , char **argv)
{
   ...
   DeviceFunc(a_h , numvar , b_h); //Showing the data
   ....
}

然后,Common.h包含:

 #ifndef __Common_H
 #define __Common_H
 #endif
 void DeviceFunc(float * , int , float *);

另外,DeviceFunc.cu在同一文件夹中:

 #include<cuda.h>
 #include<stdio.h>
 #include "Common.h"
 __device__ __global__ void Kernel(float *, float * ,int );
 void DeviceFunc(float *temp_h , int numvar , float *temp1_h)
 {
    float *a_d , *b_d;
    //Memory allocation on the device
    cudaMalloc(&a_d,sizeof(float)*(numvar)*(numvar+1));
    cudaMalloc(&b_d,sizeof(float)*(numvar)*(numvar+1));
    //Copying data to device from host
    cudaMemcpy(a_d, temp_h, sizeof(float)*numvar*(numvar+1),cudaMemcpyHostToDevice);
    //Defining size of Thread Block
    dim3 dimBlock(numvar+1,numvar,1);
    dim3 dimGrid(1,1,1);
    //Kernel call
    Kernel<<<dimGrid , dimBlock>>>(a_d , b_d , numvar);
    //Coping data to host from device
    cudaMemcpy(temp1_h,b_d,sizeof(float)*numvar*(numvar+1),cudaMemcpyDeviceToHost);
    //Deallocating memory on the device
    cudaFree(a_d);
    cudaFree(b_d);
 }
 }

现在,当我用nvcc -o main main.cpp编译代码时,我会得到此错误main.cpp:(.text+0x3a0): undefined reference to 'DeviceFunc(float*, int, float*)'

问题是什么

未定义的函数参考是在编译器找到函数的原型 and 时找不到链接>> >的原型。。为了避免此链接错误,您应该1)在一个命令处编译整个文件,或2)将编译和链接进程分开。我建议后者如下:

nvcc -c main.cpp
nvcc -c DeviceFunc.cu
nvcc -c Kernel.cu
nvcc main.o DeviceFunc.o Kernel.o -o main

请注意,您所显示的代码会错过包含车身Kernel功能的文件。我认为Kernel功能的主体包含在Kernel.cu中。

最新更新