CUDA和CuDNN版本与Tensorflow2.4.1冲突



我希望有人为您的TF2.4.1环境提供RTX 30X0。更具体地说,我想知道nvidia驱动程序,CUDA和CuDNN版本。还有TF2.4.1的安装方式。

我正在努力将tensorflow2.4.1安装到我的电脑中,下面有。操作系统:Ubuntu 20.04(版本无关紧要(CPU:Ryzen 5600XGPU:RTX 3070

我知道TF2.4.1的要求是CUDA11.0 w/CuDNN8.0.4,根据以下站点。

https://www.tensorflow.org/install/gpu

然而,NVIDIA驱动程序457版是RTX 3070的第一个版本,目前的最新版本是460版。所以,我安装了460版本,"nvidiasmi"在终端上返回如下。(CUDA版本11.2没有安装此驱动程序,正如您所知。(

|NVIDIA-SMI 460.73.01驱动程序版本:460.73.01CUDA版本:11.2|

下面NVIDIA网站的支持列表显示CUDA 11.0适用于450版本的驱动程序。这意味着它不可能是RTX 3070的版本。对于RTX 3070,我认为CUDA 11.2或更高版本是正确的,因为它支持460版本。

https://docs.nvidia.com/deeplearning/cudnn/support-matrix/index.html

安装CUDA11.2 w/CuDNN8.1.0后,我通过管道将tensorflow安装到pyenv。但是,TF运行在CPU上。我通过"tf.config.list_physical_devices('GPU'("进行了确认,它返回了"[]"正如我所料。只要TF2.4.1对NVIDIA环境的限制是有效的,你认为我不能在这台电脑上创建TF环境吗?

我在Ubuntu的新安装中尝试了很多模式。有一次我安装450版失败,出现DPKG错误,但我会再试一次。

谢谢大家。我发现我的问题解决如下。

安装Ubuntu 20.04后,安装最新的NVIDIA驱动程序。(也许不需要,因为它将与CUDA安装自动安装。(

sudo ubuntu-drivers devices
sudo apt-get install --no-install-recommends nvidia-driver-460
nvidia-smi
sudo reboot

安装TF2.4.1所需的CUDA11.0。这次我引用了runfile[local],而不是之前失败的deb[local]。https://developer.nvidia.com/cuda-11.0-update1-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=2004&target_type=运行文件本地

sudo apt update
wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3_450.51.06_linux.run
sudo sh cuda_11.0.3_450.51.06_linux.run

*警告'发现驱动程序的现有包管理器安装。'出现在上面一行,我中止了它。改为在下面完成。

sudo sh ./cuda_11.0.3_450.51.06_linux.run --toolkit --silent –-override

确认/usr/local/cuda-11.0/bin是否存在并编辑bashrc。

sudo vim ~/.bashrc

在bashrc中添加以下2行。

export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

重新加载bashrc

source ~/.bashrc

安装CuDNN。提前下载皮重图书馆。https://developer.nvidia.com/rdp/cudnn-archive

cd Downloads
tar -xzvf cudnn-11.0-linux-x64-v8.0.4.30.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
sudo apt update

将TF2.4.1安装为https://www.tensorflow.org/install/pip?hl=ja指示。

sudo apt install python3-dev python3-pip python3-venv
cd Documents/ML/tf-test1
python3 -m venv test1
source test1/bin/activate
pip install --upgrade pip
pip list
pip install --upgrade tensorflow

检查TF是否正确安装。

import tensorflow as tf
print(tf.__version__)
print(tf.config.list_physical_devices('GPU'))
print(tf.test.gpu_device_name())

当我执行CNN模型时,"无法获得卷积算法"。这可能是因为cuDNN未能初始化"发生为fit(("。然后我一如既往地在下面做。

export TF_FORCE_GPU_ALLOW_GROWTH=true

然后整理。

我有一个和你一样的ubuntu 20.4。但为了让tensorflow能够很好地看到GPU,最终对我起作用的是:tensorflow gpu 2.2.0库达10.1cudnn 7.6所有这些都配有460.73.01 版本的NVIDIA驱动器

最新更新