ubuntu20.04和ubuntu21.10上安装cuda driver貌似有所不同。可以直接使用sudo apt install命令安装。我以前用ubuntu16.04和ubuntu18.04时一直是在nvidia官网下载安装包自己安装,好像那个时候还不支持apt直接安装,所以也不清楚什么时候开始ubuntu可以使用apt安装驱动包了。
自己下载安装包安装的方法参考这里,
Ubuntu18.04查看显卡信息并安装NVDIA显卡驱动driver + Cuda + Cudnn_tanmx219的博客-CSDN博客_ubuntu查看显卡驱动
直接apt安装的方法参考这里,
Install or Upgrade Nvidia Drivers on Ubuntu 21.10 Impish Indri - LinuxCapable
how to properly install nvidia 470 drivers on ubuntu 20.04? - Ask Ubuntud
上面说的大致意思是这样的,
sudo apt update sudo apt remove '^nvidia' sudo apt autoremove sudo apt-get purge 'nvidia*' sudo apt autoremove sudo apt install nvidia-driver-460安装驱动
在ubuntu20.04上,我实际上只使用了两条指令:
sudo apt update && sudo apt upgrade -y sudo ubuntu-drivers autoinstall
安装过程中涉及到要不要生成Secure Boot MOK(machine owner key)的问题,当然是选择生成。生成后要输入一个临时密码,随便输入一个,比如Key123456,记住这个密码,因为重启的时候要输入。
重启后,MOK界面会弹出来,要记得选择Enroll Key --> Key on disk之类的,就是把你刚才生成的Key注册到linux内核。已经有了这个Key之后,Secure Boot 是Enable还是Disable就不再那么重要了。
重启后用nvidia-smi命令查看,正常的话会输出相关信息,如下图,
安装cuda-toolkit 自动安装cuda-toolkit安装好驱动后就重启,确定一切没有问题,接下来就要安装cuda toolkit了。最简单的办法是
sudo apt install nvidia-cuda-toolkit
手动安装cuda-toolkit反正当时我没有找到"sudo apt install cuda"这样的简易方法,就只好照老规矩,去网站上下载了再安装。
下载地址在这里,
https://developer.nvidia.com/cuda-toolkit-archive
官网给出了好几种包,我选的手动安装包,根据官网的提示,安装方法是这样的
wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run
sudo sh cuda_11.4.0_470.42.01_linux.run
下载的时候注意看版本,比如我的电脑提示驱动是470.86,但我没找到这个470.86的toolkit,所有cuda11.4的包我全部列在下面,我只能用一个最相近的包,版本是470.82,也就是列出来的最后一个包,
https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run
https://developer.download.nvidia.com/compute/cuda/11.4.1/local_installers/cuda_11.4.1_470.57.02_linux.run
https://developer.download.nvidia.com/compute/cuda/11.4.2/local_installers/cuda_11.4.2_470.57.02_linux.run
https://developer.download.nvidia.com/compute/cuda/11.4.3/local_installers/cuda_11.4.3_470.82.01_linux.run
安装完了一般还需要添加环境变量(现在不知道是不是可以不添加,没去查,反正我加上了),
sudo gedit ~/.bashrc
在 ~/.bashrc 的最后添加 (网上共看到三种添加内容):
第一种
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
第二种
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda10.2/lib64
第三种(* $PATH表示添加到PATH)
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda
配置完环境变量之后,一定要更新一下,否则不能立即生效。也可以通过重启电脑使得环境变量生效:
$source ~/.bashrc
或者:
$source /etc/profile
最后,
$nvcc --version
————————————————
Installation Guide :: NVIDIA Deep Learning cuDNN documentation
- Navigate to your
$ tar -xvf cudnn-linux-x86_64-8.x.x.x_cudaX.Y-archive.tar.xzCopy the following files into the CUDA toolkit directory.
$ sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include $ sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 $ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
我根据自己的版本,操作如下
$ tar -xzvf cudnn-11.4-linux-x64-v8.2.4.15.tgz $ sudo cp cuda/include/cudnn.h /usr/local/cuda/include $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 $ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
===================================================================
这里最重要的就是要安装好驱动,参考文件的原文内容就不抄了,网络上不去的就看下面的图,



