nvlink可以从单独的编译单元内联设备函数吗



如果作为输入提供给nvlink的单独编译单元包含调用标记为__forceinline__的设备函数的cuda内核和设备函数,这些函数会被内联吗?假设如果将所有源代码放在一个文件中,它们将被内联。

如果作为输入提供给nvlink的单独编译单元包含调用标记为__forceinline__的设备函数的cuda内核和设备函数,这些函数会被内联吗?

据我所知,CUDA设备代码链接器无法做到这一点。__forceinline__指令是编译器级别的操作,编译后,无法在PTX或SASS中将代码标记为可内联。如果尝试此操作,CUDA设备代码编译器应发出一个警告,说明使用了外部内联函数,但未定义该函数。

如果希望函数以内联方式编译,则必须(毫不奇怪(使用编译器,而不是链接器。

相关内容

  • 没有找到相关文章

最新更新