手把手教你Anaconda搭建pytorch gpu版本

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、Anaconda搭建流程
- 1.Anaconda下载
- 2.Anaconda安装
- 3.Anaconda环境变量配置
二、cuda搭建流程
- 1.cuda下载
- 2.cuda安装
- 3.cuda环境变量配置
三、cudnn搭建流程
- 1.cudnn下载
- 2.cudnn安装
- 3.cudnn环境变量配置
四、pytorch搭建流程
- 1.pytorch安装
- 2.pytorch验证
五、pycharm搭建流程
- 1.安装包下载
- 2.pycharm安装
- 3.pycharm设置
六、遇到问题及解决方法
- 1.import包失败问题
- 2.RTX3080+cuda问题
七、总结
参考资料

前言

最近新入手了两台3080服务器，因此需要重新搭建一下pytorch-gpu环境。搭建过程中遇到了很多的坑，比如虽然安装了cuda对应的cudnn以及pytorch版本，但是还是不能正确调用gpu进行加速运算，为避免大家遇到相似问题，给大家提供一套自己亲测成功的搭建流程，避免入坑。
版本：python3.8.12+cuda11.1.0+cudnn8.0.5+pytorch1.9.1

一、Anaconda搭建流程

推荐使用Anaconda进行环境管理，其核心功能是包管理与环境管理。

1.Anaconda下载

下载地址： https://www.anaconda.com/download/

根据自己电脑需求选择版本，这里我选择的是Windows 64bit版本。

2.Anaconda安装

打开下载好的安装包进行Anaconda的安装

选择All users

选择默认安装路径

此处不选择自动添加环境变量。安装完以后我们手动添加。

点击finish完成anaconda安装

3.Anaconda环境变量配置

右键我的电脑–属性–高级系统设置–环境变量–系统变量–Path，进行Anaconda系统变量的添加。

以管理员身份运行Anaconda prompt，在命令行输入conda --version
出现如图所示版本号，那么恭喜你安装成功，可以进行后续cuda安装

二、cuda搭建流程 1.cuda下载

下载地址： https://developer.nvidia.com/cuda-downloads

默认为最新版cuda下载，点击红框内链接，进行历史版本的下载选择。

此处选择cuda 11.1.0版本进行下载。

进行如图所示选择完成对cuda的下载。

2.cuda安装

打开下载好的安装包进行cuda的安装

选择默认提取路径

选择自定义安装

选择组件，点击下一步

确定如图所示安装路径

安装完成

3.cuda环境变量配置

打开系统环境变量，看是否添加了如下图所示的系统变量

重启电脑，win+r打开cmd控制台，命令行输入nvcc -V，如下图所示显示cuda版本号，则表示安装成功。

三、cudnn搭建流程 1.cudnn下载

下载地址： https://developer.nvidia.com/rdp/cudnn-archive

选择对应cuda版本号下载对应的cudnn版本。

根据电脑和系统配置选择安装包。

2.cudnn安装

将下载好的cudnn安装包进行解压，打开文件路径得到如图所示文件夹

然后打开cuda的安装路径，我的安装路径是：C:Program FilesNVIDIA GPU Computing ToolkitCUDAv11.1 如下图所示

分别将cudnn文件路径下三个文件夹bin,nclude,libx64中的dll,.h,.lib文件复制到cuda对应的文件夹路径下。

3.cudnn环境变量配置

为cudnn添加环境变量，如下图所示

完成cudnn的安装。

四、pytorch搭建流程 1.pytorch安装

以管理员身份运行Anaconda prompt，在控制台中创建自定义的开发环境，此处建议创建python3.8版本的环境

conda create -n pytorch-gpu python=3.8

在prompt控制台中执行下述命令进入刚才创建好的pytorch-gpu环境

activate pytprch-gpu

打开 https://pytorch.org/，选择对应的版本参数，获取pytorch对应源码的下载指令。

将获得的下载指令输入到激活后的pytorch-gpu环境下的控制台中，进行pytorch的安装

conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c conda-forge

2.pytorch验证

prompt控制台激活pytorch-gpu环境下，输入下述指令

>>>python
>>>import torch
>>>torch.cuda.is_available()

显示如下图所示输出True，则表示安装成功。

五、pycharm搭建流程 1.安装包下载

下载地址： https://www.jetbrains.com/pycharm/download/#section=windows
由于专业版本需要激活码，选择社区版本进行免费下载

2.pycharm安装

点击下载好的安装包，进行pycharm的安装

自定义安装目录

勾选完，点击next

点击install

点击finish完成pycharm安装

3.pycharm设置

打开pycharm，点击New Project创建新工程

选择base interpreter设置，进行解释器的选择，找到Anaconda3envs路径下的自定义的pytorch-gpu环境中的python.exe作为基解释器。

点击创建，则完成基础环境的设置

新建python文件，如图所示测试代码，检测pycharm环境下的pytorch-gpu环境是否配置成功。

import torch
print(torch.__version__)
print(torch.cuda.is_available())
print(torch.zeros(1).cuda())    ##建议使用这条指令，确保gpu可以正常运行（会在下一章常见问题第二个进行详细讲解）

如图所示，则大功告成！！！可以继续开发前行

六、遇到问题及解决方法 1.import包失败问题

错误信息如下

importError: DLL load failed: 找不到指定的模块。

一般正常安装的话，在Anaconda prompt控制台能正确导入包，而在pycharm环境中会出现此类问题。导致此类问题的原因我遇到的有三种。其一是环境变量的配置，可以一步一步查找环境变量是否有问题。其二是版本对应问题，比如cuda、cudnn、python、pytorch版本等，建议按照的趟好路的版本进行下载。其三是numpy包版本问题，直接在Anaconda prompt控制台中对numpy进行更新，命令如下：

activate pytorch-gpu       ##进入自定义pytorch环境
conda upgrade numpy        ##更新numpy包

2.RTX3080+cuda问题

错误信息如下

UserWarning: 
NVIDIA GeForce RTX 3080 with CUDA capability sm_86 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37.
If you want to use the NVIDIA GeForce RTX 3080 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/

我在第一次搭建的过程中，采用的是cuda10.2版本，测试时运行print(torch.cuda.is_available())正常，但每次真正用gpu进行计算的时候均会出现这个问题，后来查找解决方法，在参考资料[1]找找到了解决办法。更换了cuda版本，因此建议安装之前一定要做好版本的调研，确定版本兼容问题。还有在检测pytorch-gpu版本是否能正常运行建议使用print(torch.zeros(1).cuda())指令，确保gpu能够正常工作。

七、总结

对应版本！对应版本！对应版本！
附赠一些Anaconda实用的包管理指令，方便大家开发
新建环境：conda create -n env_name python=3.x
删除环境：conda remove -n env_name –all
查看环境：conda info -e

参考资料

[1]https://github.com/pytorch/pytorch/issues/45028

手把手教你Anaconda搭建pytorch gpu版本

Python相关栏目本月热门文章