提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录- 前言
- 一、Anaconda搭建流程
- 1.Anaconda下载
- 2.Anaconda安装
- 3.Anaconda环境变量配置
- 二、cuda搭建流程
- 1.cuda下载
- 2.cuda安装
- 3.cuda环境变量配置
- 三、cudnn搭建流程
- 1.cudnn下载
- 2.cudnn安装
- 3.cudnn环境变量配置
- 四、pytorch搭建流程
- 1.pytorch安装
- 2.pytorch验证
- 五、pycharm搭建流程
- 1.安装包下载
- 2.pycharm安装
- 3.pycharm设置
- 六、遇到问题及解决方法
- 1.import包失败问题
- 2.RTX3080+cuda问题
- 七、总结
- 参考资料
前言
一、Anaconda搭建流程最近新入手了两台3080服务器,因此需要重新搭建一下pytorch-gpu环境。搭建过程中遇到了很多的坑,比如虽然安装了cuda对应的cudnn以及pytorch版本,但是还是不能正确调用gpu进行加速运算,为避免大家遇到相似问题,给大家提供一套自己亲测成功的搭建流程,避免入坑。
版本:python3.8.12+cuda11.1.0+cudnn8.0.5+pytorch1.9.1
1.Anaconda下载推荐使用Anaconda进行环境管理,其核心功能是包管理与环境管理。
2.Anaconda安装下载地址: https://www.anaconda.com/download/
根据自己电脑需求选择版本,这里我选择的是Windows 64bit版本。
3.Anaconda环境变量配置打开下载好的安装包进行Anaconda的安装
选择All users
选择默认安装路径
此处不选择自动添加环境变量。安装完以后我们手动添加。
点击finish完成anaconda安装
二、cuda搭建流程 1.cuda下载右键我的电脑–属性–高级系统设置–环境变量–系统变量–Path,进行Anaconda系统变量的添加。
以管理员身份运行Anaconda prompt,在命令行输入conda --version
出现如图所示版本号,那么恭喜你安装成功,可以进行后续cuda安装
2.cuda安装下载地址: https://developer.nvidia.com/cuda-downloads
默认为最新版cuda下载,点击红框内链接,进行历史版本的下载选择。
此处选择cuda 11.1.0版本进行下载。
进行如图所示选择完成对cuda的下载。
3.cuda环境变量配置打开下载好的安装包进行cuda的安装
选择默认提取路径
选择自定义安装
选择组件,点击下一步
确定如图所示安装路径
安装完成
三、cudnn搭建流程 1.cudnn下载打开系统环境变量,看是否添加了如下图所示的系统变量
重启电脑,win+r打开cmd控制台,命令行输入nvcc -V,如下图所示显示cuda版本号,则表示安装成功。
2.cudnn安装下载地址: https://developer.nvidia.com/rdp/cudnn-archive
选择对应cuda版本号下载对应的cudnn版本。
根据电脑和系统配置选择安装包。
3.cudnn环境变量配置将下载好的cudnn安装包进行解压,打开文件路径得到如图所示文件夹
然后打开cuda的安装路径,我的安装路径是:C:Program FilesNVIDIA GPU Computing ToolkitCUDAv11.1 如下图所示
分别将cudnn文件路径下三个文件夹bin,nclude,libx64中的dll,.h,.lib文件复制到cuda对应的文件夹路径下。
四、pytorch搭建流程 1.pytorch安装为cudnn添加环境变量,如下图所示
完成cudnn的安装。
以管理员身份运行Anaconda prompt,在控制台中创建自定义的开发环境,此处建议创建python3.8版本的环境
conda create -n pytorch-gpu python=3.8
在prompt控制台中执行下述命令进入刚才创建好的pytorch-gpu环境
activate pytprch-gpu
打开 https://pytorch.org/,选择对应的版本参数,获取pytorch对应源码的下载指令。
将获得的下载指令输入到激活后的pytorch-gpu环境下的控制台中,进行pytorch的安装
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c conda-forge2.pytorch验证
prompt控制台激活pytorch-gpu环境下,输入下述指令
>>>python >>>import torch >>>torch.cuda.is_available()
显示如下图所示输出True,则表示安装成功。
2.pycharm安装下载地址: https://www.jetbrains.com/pycharm/download/#section=windows
由于专业版本需要激活码,选择社区版本进行免费下载
3.pycharm设置点击下载好的安装包,进行pycharm的安装
自定义安装目录
勾选完,点击next
点击install
点击finish完成pycharm安装
打开pycharm,点击New Project创建新工程
选择base interpreter设置,进行解释器的选择,找到Anaconda3envs路径下的自定义的pytorch-gpu环境中的python.exe作为基解释器。
点击创建,则完成基础环境的设置
新建python文件,如图所示测试代码,检测pycharm环境下的pytorch-gpu环境是否配置成功。
import torch print(torch.__version__) print(torch.cuda.is_available()) print(torch.zeros(1).cuda()) ##建议使用这条指令,确保gpu可以正常运行(会在下一章常见问题第二个进行详细讲解)
如图所示,则大功告成!!!可以继续开发前行
错误信息如下
importError: DLL load failed: 找不到指定的模块。
一般正常安装的话,在Anaconda prompt控制台能正确导入包,而在pycharm环境中会出现此类问题。导致此类问题的原因我遇到的有三种。其一是环境变量的配置,可以一步一步查找环境变量是否有问题。其二是版本对应问题,比如cuda、cudnn、python、pytorch版本等,建议按照的趟好路的版本进行下载。其三是numpy包版本问题,直接在Anaconda prompt控制台中对numpy进行更新,命令如下:
activate pytorch-gpu ##进入自定义pytorch环境 conda upgrade numpy ##更新numpy包2.RTX3080+cuda问题
错误信息如下
UserWarning: NVIDIA GeForce RTX 3080 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37. If you want to use the NVIDIA GeForce RTX 3080 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/
我在第一次搭建的过程中,采用的是cuda10.2版本,测试时运行print(torch.cuda.is_available())正常,但每次真正用gpu进行计算的时候均会出现这个问题,后来查找解决方法,在参考资料[1]找找到了解决办法。更换了cuda版本,因此建议安装之前一定要做好版本的调研,确定版本兼容问题。还有在检测pytorch-gpu版本是否能正常运行建议使用print(torch.zeros(1).cuda())指令,确保gpu能够正常工作。
七、总结对应版本!对应版本!对应版本!
附赠一些Anaconda实用的包管理指令,方便大家开发
新建环境:conda create -n env_name python=3.x
删除环境:conda remove -n env_name –all
查看环境:conda info -e
[1]https://github.com/pytorch/pytorch/issues/45028



