编译/添加 cuda 代码到现有项目 (CMake)



我正在尝试通过 CUDA 代码将现有项目的一部分移植到 GPU。我知道cmake有选项(find_cuda...(单独处理.cu文件,但我仍在尝试弄清楚如何在现有项目的上下文中使用这个生态系统。

我的问题如下。假设我有一个带有 cmake 配置文件 (CMakeLists( 的现有C++项目。目前的做法是优雅地(如果可能的话(包含 CUDA 内核?CMakeLists是否可以以某种方式构造,.cu文件仅在GPU存在时才编译?

我目前的想法是创建一个单独的文件夹,其中仅存在与 CUDA 相关的代码,然后将其编译为静态库。这是这样做的方法吗?

将 CUDA 文件放在单独的文件夹中是我推荐的方法,但不是必需的。基本原则是收集 CMake 变量中的所有 .cu 文件(我们称之为CUDA_SRC(,并将所有.cpp文件收集到不同的变量中(称为SRC(。现在,您将编译这两个文件并将它们放在一起。find_package(CUDA)提供的变量CUDA_FOUND可用于确定系统上是否安装了 CUDA。不需要对 cuda 文件使用静态库,但我将在这里向您展示这两种方法。

在你的顶级cmake文件中,你想要这样的东西来查找CUDA并设置一些nvcc标志:

find_package(CUDA QUIET)
if(CUDA_FOUND)
include_directories(${CUDA_INCLUDE_DIRS})
SET(ALL_CUDA_LIBS ${CUDA_LIBRARIES} ${CUDA_cusparse_LIBRARY} ${CUDA_cublas_LIBRARY})
SET(LIBS ${LIBS} ${ALL_CUDA_LIBS})
message(STATUS "CUDA_LIBRARIES: ${CUDA_INCLUDE_DIRS} ${ALL_CUDA_LIBS}")
set(CUDA_PROPAGATE_HOST_FLAGS ON)
set(CUDA_SEPARABLE_COMPILATION OFF)
list( APPEND CUDA_NVCC_FLAGS -gencode=arch=compute_30,code=compute_30 )
list( APPEND CUDA_NVCC_FLAGS -gencode=arch=compute_52,code=sm_52 )
endif()

使用静态 CUDA 库

if(CUDA_FOUND)
#collect CUDA files
FILE(GLOB_RECURSE CUDA_SRC  *.cu)
#build static library
CUDA_ADD_LIBRARY(my_cuda_lib ${CUDA_SRC} STATIC)
SET(LIBS ${LIBS} ${my_cuda_lib})
endif()
#collect cpp files
FILE(GLOB_RECURSE SRC  *.cpp)
#compile .cpp files and link it to all libraries
add_executable(${PROG_NAME} ${SRC})
target_link_libraries(${PROG_NAME} ${LIBS} )

没有静态 CUDA 库

FILE(GLOB_RECURSE SRC  *.cpp)
if(CUDA_FOUND)
#compile cuda files and add the compiled object files to your normal source files
FILE(GLOB_RECURSE CUDA_SRC  *.cu)
cuda_compile(cuda_objs ${CUDA_SRC})
SET(SRC ${SRC} ${cuda_objs})
endif()
#compile .cpp files and link it to all libraries
add_executable(${PROG_NAME} ${SRC})
target_link_libraries(${PROG_NAME} ${LIBS} )

最新更新