我想使用 HPC 的 GPU 并尝试模块添加 CUDA...但是错误会发生。错误是"Lmod 检测到以下错误:


Lmod has detected the following error:  Unable to load module
because of error when evaluating modulefile:
/trinity/shared/easybuild/modules/all/CUDA/11.1.1-GCC-10.2.0.lua: Empty or
non-existant file
Please check the modulefile and especially if there is a the line number
specified in the above message
While processing the following module(s):
Module fullname         Module Filename
---------------         ---------------
CUDA/11.1.1-GCC-10.2.0  /trinity/shared/easybuild/modules/all/CUDA/11.1.1-GCC-10.2.0.lua

这个错误令人困惑。我键入了rm –rf ~/.lmod.d/.cache,但它不起作用。如何解决这个问题?

你能cat /trinity/shared/easybuild/modules/all/CUDA/11.1.1-GCC-10.2.0.lua吗?也许您的modulefile不存在。

如果modulefile不存在:一般情况下,您可以用luatcl文件写下modulefile。试着制作一些这样的文件!

#%Module
set s /usr/local/cuda-11.1
prepend-path PATH $s/bin
prepend-path LIBRARY_PATH $s/lib
prepend-path LD_LIBRARY_PATH $s/lib
prepend-path LIBRARY_PATH $s/lib64
prepend-path LD_LIBRARY_PATH $s/lib64
prepend-path CPATH $s/include
prepend-path INCLUDE $s/include

最新更新