C语言 编译 CUDA 库:适用于 Mac,而不是 Ubuntu



我正在第一次尝试构建一个充满CUDA例程的.so。我有matrix_vector_mult.cu文件,目前什么都不做:

#include <stdio.h>
extern "C"
double *
matrix_vector_mult(const double ** const M,
                   const double * const v,
                   const size_t num_rows,
                   const size_t num_cols)
{
    printf("Hello!n");
    double * p = (double *) malloc(num_rows*sizeof(double));
    return p;
}

我还有一个制作文件,其内容如下:

CC := clang
UNAME := $(shell uname -s)
ifeq ($(UNAME), Darwin)
CUDA_PATH := /Developer/NVIDIA/CUDA-6.5
CUDA_LIB := ${CUDA_PATH}/lib
endif
ifeq ($(UNAME), Linux)
CUDA_PATH := /usr/local/cuda-6.5
CUDA_LIB := ${CUDA_PATH}/lib64
endif
LIBS := -L ${CUDA_LIB} -lcudart -lcudadevrt
NVCC := ${CUDA_PATH}/bin/nvcc -ccbin ${CC}
CFLAGS := -g -std=c11 -Wextra -Wall -I include -rpath ${CUDA_LIB}
NVCCFLAGS := -g -m64 -D__STRICT_ANSI__
vpath %.cu src
vpath %.h include
all: matrix_vector_mult.o
        ${CC} ${CFLAGS} -o matrix_vector_mult.so -shared -fPIC $^ ${LIBS}
matrix_vector_mult.o: matrix_vector_mult.cu
        ${NVCC} ${NVCCFLAGS} -o $@ -c $^
clean:
        rm -f *.o *.so *.pyc

在Mac上,这编译得很好。但是,在我的 Ubuntu 盒子上,我收到错误消息:

/usr/bin/ld: matrix_vector_mult.o: relocation R_X86_64_32S against `.rodata.str1.1' can not be used when making a shared object; recompile with -fPIC
matrix_vector_mult.o: error adding symbols: Bad value

可能是什么问题?(将-fPIC添加到编译行不起作用。 nvcc --version在两个框上产生相同的信息,clang --version给出

Apple LLVM version 6.0 (clang-600.0.56) (based on LLVM 3.5svn)

在 Mac 上,以及

Ubuntu clang version 3.4-1ubuntu3 (tags/RELEASE_34/final) (based on LLVM 3.4)

在 Ubuntu 盒子上。我有点怀疑轻微的LLVM版本差异是问题所在,因为我认为makefile已经一团糟了。任何帮助表示赞赏。

构建主机对象的共享库通常需要编译这些对象,以便它们仅包含与位置无关的代码。如错误消息所示,您可以使用 gcc 的 gnu-linux 系统上的 -fPIC 主机编译器选项执行此操作。

NVCC包含一个选项-XCompiler,可用于将选项传递给主机编译器。因此,向用于生成用于构建共享库的主机代码的编译语句中添加-XCompiler="-fPIC"可用于解决此特定问题。

相关内容

最新更新