如何在谷歌 colab 上安装 CUDA 时修复此"dpkg"错误



我想在google colab上运行CUDA代码。为此,我遵循以下步骤,但我无法安装CUDA软件包。

步骤1:删除以前的CUDA版本

!apt-get --purge remove cuda nvidia* libnvidia-*
!dpkg -l | grep cuda- | awk '{print $2}' | xargs -n1 dpkg --purge
!apt-get remove cuda-*
!apt autoremove
!apt-get update

It is running fine.

步骤2:安装新的CUDA软件包

!wget https://developer.nvidia.com/compute/cuda/9.2/Prod/local_installers/cuda-repo-ubuntu1604-9-2-local_9.2.88-1_amd64 -O cuda-repo-ubuntu1604-9-2-local_9.2.88-1_amd64.deb
!dpkg -i cuda-repo-ubuntu1604-9-2-local_9.2.88-1_amd64.deb
!apt-key add /var/cuda-repo-9-2-local/7fa2af80.pub
!apt-get update
!apt-get install cuda-9.2

给出错误在结尾像这样:

Errors were encountered while processing:
/tmp/apt-dpkg-install-Bocamn/67-nvidia-396_396.26-0ubuntu1_amd64.deb
E: Sub-process /usr/bin/dpkg returned an error code (1)

步骤3:

!nvcc --version

我得到的错误如下:

/bin/bash: nvcc: command not found

我之前使用上述步骤运行CUDA代码,但现在它不起作用。你能帮我解决这个错误吗?

我在Google Colab上使用CUDA 10.0运行我的代码,直到两周前才工作正常。我使用类似的代码在Colab上安装CUDA 10.0,即

!apt-get --purge remove cuda nvidia* libnvidia-*
!dpkg -l | grep cuda- | awk '{print $2}' | xargs -n1 dpkg --purge
!apt-get remove cuda-*
!apt autoremove
!apt-get update
!wget  --no-clobber https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
#install CUDA kit dpkg
!dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
!sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
!apt-get update
!apt-get install cuda-10-0

我认为你的代码的第一个块是工作的。因为它成功地卸载了Colab上当前的CUDA版本(11.2版本),当您检查!nvcc—version时,您会看到没有安装CUDA。问题在于代码的第二个块,它使用公钥"7fa2af80";从这个仓库安装CUDA 9.2 https://developer.nvidia.com/compute/cuda/9.2/Prod/local_installers/cuda-repo-ubuntu1604-9-2-local_9.2.88-1_amd64

我猜问题是公钥"7fa2af80"NVIDIA从4月27日起已弃用。你可以在这里找到更多的信息。

我在尝试在Colab上设置nvcc时遇到了同样的错误。Colab已经安装了nvcc,所以不需要安装它。不幸的是,既然你已经卸载了nvcc,请使用一个单独的gmail帐户并打开一个新的colab笔记本。

运行:

nvcc --version

查看NVCC是否已经安装。

下一步安装扩展运行C/c++ CUDA程序通过运行:

!pip install git+https://github.com/andreinechaev/nvcc4jupyter.git

在下一个单元格中,加载已安装的扩展:

%load_ext nvcc_plugin

现在你可以运行cuda程序了。运行一个C CUDA示例代码:

%%cu
// Your C code

我也遇到过同样的问题,但我找到了一个不安装cuda软件包的解决方案。

1-在colab上使用默认cuda版本:

!学校网站——版本

输出将是:-

nvcc: NVIDIA (R) Cuda编译器驱动程序Copyright (c) 2005-2020 NVIDIA Corporation构建于Mon_Oct_12_20:09:46_PDT_2020 Cuda编译工具,release 11.1;V11.1.105 Build cuda_11. tc455_06 .29190527_0


2 -使用% % writefile & lt; file_name> .cu而不是%%cu


3-使用!NVCC -arch=sm_37 -gencode=arch=compute_37,code=sm_37编译代码


4 -使用!。/& lt; file_name>要运行代码

感谢这个链接,它帮助我解决了这个问题

最新更新