我刚刚开始使用 CUDA 16.04 的 Ubuntu 7.5 全新安装,并在安装 OpenCV3.1 时遇到问题。
当我运行make时,我收到以下错误:
[ 9%] Building NVCC (Device) object modules/core/CMakeFiles/cuda_compile.dir/src/cuda/cuda_compile_generated_gpu_mat.cu.o
/usr/include/string.h: In function ‘void* __mempcpy_inline(void, const void, size_t)’:
/usr/include/string.h:652:42: error: ‘memcpy’ was not declared in this scope
return (char *) memcpy (__dest, __src, __n) + __n;
我在各种(封闭的)github错误/问题讨论线程中找到了一个解决方案,如下所示:
In opencv/cmake/OpencvDetectCuda.cmake, change
set(NVCC_FLAGS_EXTRA ${NVCC_FLAGS_EXTRA} -gencode arch=compute_${CMAKE_MATCH_2},code=sm_${CMAKE_MATCH_1})
to
set(NVCC_FLAGS_EXTRA ${NVCC_FLAGS_EXTRA} -D_FORCE_INLINES -gencode arch=compute_${CMAKE_MATCH_2},code=sm_${CMAKE_MATCH_1})
这个解决方案对我有用,但我仍然不明白最初的问题或解决方案。为什么添加标志 -D_FORCE_INLINE解决问题?为什么 string.h 有问题?这是(我认为)正在编译的更稳定的文件之一。我希望任何错误与 CUDA7.5 或 OpenCV3.1 相关联?
如果我再次看到此问题,如何识别它?
显然,/usr/include/string.h 从 glib2.22 变成了 glibc2.23 (https://fossies.org/diffs/glibc/2.22_vs_2.23/string/string.h-diff.html)。添加的代码位于文件底部,为:
#if defined __USE_GNU && defined __OPTIMIZE__
&& defined __extern_always_inline && __GNUC_PREREQ (3,2)
# if !defined _FORCE_INLINES && !defined _HAVE_STRING_ARCH_mempcpy
#undef mempcpy
#undef __mempcpy
#define mempcpy(dest, src, n) __mempcpy_inline (dest, src, n)
#define __mempcpy(dest, src, n) __mempcpy_inline (dest, src, n)
__extern_always_inline void *
__mempcpy_inline (void *__restrict __dest,
const void *__restrict __src, size_t __n)
{
return (char *) memcpy (__dest, __src, __n) + __n;
}
# endif
#endif
我看到的阻止此新代码触发memcpy错误的方法是:
1 只需注释掉此代码
2 为NVCC的标志添加D_FORCE_INLINES
(https://github.com/opencv/opencv/issues/6500
Simple replace in opencv/cmake/OpencvDetectCuda.cmake
set(NVCC_FLAGS_EXTRA ${NVCC_FLAGS_EXTRA} -gencode arch=compute_${CMAKE_MATCH_2},code=sm_${CMAKE_MATCH_1})
to
set(NVCC_FLAGS_EXTRA ${NVCC_FLAGS_EXTRA} -D_FORCE_INLINES -gencode arch=compute_${CMAKE_MATCH_2},code=sm_${CMAKE_MATCH_1})
或者,对于类似的错误,将D_FORCE_INLINES添加到 cc 的 ccflags 中(但我现在找不到参考)
现在,我正在尝试弄清楚这段代码的作用....