Ubuntu 14.04上的Caffe安装问题



我成功地在我的双启动笔记本电脑(GTX 860M,Windows 7+Ubuntu 14.04.2)上安装了caffe。所有测试都成功通过。然而,当我重新启动时,ubuntu卡在了打开的屏幕上(带有ubuntu标志和五个红点的屏幕)。不知道该怎么办。

以前有人遇到过同样的问题吗?我认为显卡驱动程序启动有问题。我安装了最新的CUDA 7工具包,里面内置了nvidia驱动程序。由于在我重新启动之前所有的测试都通过了,所以一旦成功启动,驱动程序似乎就可以工作了。

卡住的屏幕是这样的:https://i.stack.imgur.com/pRtEF.jpg

我在系统上安装Caffe时遇到了类似的问题。下面的步骤对我有效,但它至少有一个已知的问题(记录在下面)。

我不确定到底是什么原因导致了这个问题,但它肯定与英伟达驱动程序和Cuda工具包的安装有关,并且不是由Caffe引起的。

在完成以下步骤后,我已经能够通过以下教程和指南在我的系统上成功安装Caffe:

  • 官方安装指南
  • Github安装指南

更新

最近,我在尝试使Cuda 7.5在Ubuntu 14.04上运行时遇到了完全相同的问题这种方法也解决了这个问题。规格:

  • CPU:Intel Core i7-4700MQ(4x 2.40 GHz,带超线程)
  • GPU:NVidia GT 940M
  • 内存:8 GB
  • HDD:52.7 GB(其中安装后使用6.7 GB)

在UBUNTU 14.04上安装NVIDIA驱动程序和CUDA

来源:ubuntuforums.org/showthread.php?t=2246526

!!已知问题

  • 系统暂停(或休眠,未确认)后,所有使用英伟达驱动程序和Cuda 6.5工具包的应用程序都将冻结。发生这种情况时,命令sudo shutdown -r now将打印重新启动消息,但不会发生任何事情

在全新的64位Ubuntu 14.04安装上执行并测试,硬件规格如下:

  • CPU:Intel Core i5-2410m(2x2.30 GHz,带超线程)
  • GPU:NVidia GT 540M
  • 内存:6 GB
  • HDD:52.7 GB(其中安装后使用8.6 GB)

安装前执行了以下命令:

sudo apt-get -y build-essential vim git llvm clang

以下步骤使系统稳定,并安装了最新的Nvidia驱动程序和Cuda 6.5工具包:

  1. 删除以前/遗留的Nvidia驱动程序和Cuda工具包的所有痕迹,或执行新的Ubuntu 14.04安装。

  2. 将适用于Ubuntu 14.04的最新Nvidia Driver.run文件和您的系统规范下载到~/Downloads目录。例如:NVIDIA-Linux-x86_64-346.35.run

  3. 将适用于Ubuntu 14.04的最新Cuda 6.5 Toolkit.run文件和您的系统规范下载到~/Downloads目录中。例如:cuda_6.5.14_linux_64.run

  4. 通过在/etc/modprobe.d/blacklist.conf中添加以下行,将"nouveau"驱动程序列入黑名单(nouveau是Nvidia卡的免费开源驱动程序,它是Ubuntu 14.04的默认驱动程序):

    blacklist nouveau
    options nouveau modeset=0

  5. 重新启动系统,执行NOT登录,但使用CTRL+ALT+F1

  6. 杀死lightdm(用你自己的显示管理器替换"lightdm",如果你已经更改了它,lightdm是Ubuntu 14.04的默认设置):

    sudo service lightdm stop

下一步至关重要,请确保在继续之前检查两次

  1. 使用--no-opengl-files选项运行英伟达驱动程序安装程序(该选项可防止OpenGL文件被覆盖;如果没有该选项,Unity将无法正常工作,登录后屏幕将冻结):

    sudo chmod +x ~/Downloads/NVIDIA-Linux-x68_64-346.35.run
    sudo ~/Downloads/NVIDIA-Linux-x68_64-346.35.run --no-opengl-files

  2. 接受EULA并确认所有进一步的警告,但拒绝安装任何额外的内容。

  3. 重新启动并登录到桌面,使用"其他驱动程序"(系统设置>软件和更新>其他驱动程序)实用程序验证手动安装的驱动程序是否正在使用。

  4. 打开终端并安装Cuda 6.5工具包:

    sudo chmod +x ~/Downloads/cuda_6.5.14_linux_64.run
    sudo ~/Downloads/cuda_6.5.14_linux_64.run

  5. 接受EULA,执行NOT安装驱动程序,安装Toolkit和示例(如果需要),保留所有默认目录。

  6. 通过在~/.bashrc:中添加以下行添加Cuda 6.5 Toolkit环境变量

    # For 32-bit systems, append these:
    export PATH=$PATH:/usr/local/cuda-6.5/bin
    export LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib

    # For 64-bit systems, append these:
    export PATH=$PATH:/usr/local/cuda-6.5/bin
    export LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib64

英伟达驱动程序和Cuda 6.5工具包现在应该已经正确安装。

可选:确认您的Nvidia Driver和Cuda 6.5 Toolkit安装。

  1. 通过运行以下命令确认英伟达驱动程序安装:

    nvidia-smi

  2. 通过运行以下命令确认Cuda编译器的安装:

    nvcc -V

  3. 通过构建和运行可选安装的Cuda来确认一切正常。示例:(使用"make"需要构建必需)

    sudo apt-get install -y build-essential
    cd ~/NVIDIA_CUDA-6.5_SAMPLES/1_Utilities/deviceQuery
    make
    ./deviceQuery
    cd ~/NVIDIA_CUDA-6.5_SAMPLES/1_Utilities/bandwidthTest
    make
    ./bandwidthTest

这个问题与caffe无关。

问题是从ubuntu软件中心安装的英伟达驱动程序不支持您的卡。

从英伟达网站卸载任何nvidia软件包(sudo apt-get purge nvidia-*)并安装最新驱动程序版本。

我建议您更改cuda 7.5 ubuntu 15.04版本。我在ubuntu 14.04上尝试了一下,它解决了这个问题。当我在ubuntu 14.04上安装cuda 7.5 ubuntu 1404版本时,我解决了这个问题。

最新更新