栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

机器学习环境配置(Tesla K80安装PyTorch的全过程)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

机器学习环境配置(Tesla K80安装PyTorch的全过程)

"""Waring:多图预警"""

 本以为update&upgrade要花上大半天,ali云真的快

先查看一下Ubuntu默认的Python版本 

反正要装Anaconda的是不是不用管这个啊

sudo reboot

然后访问Anaconda官网,下载

 再SFTP传过去

sudo bash Anaconda3-2021.05-Linux-x86_64.sh

 持续enter

Do you accept the license terms?

yes

 继续enter,使用默认安装位置

等待安装............

 

 

它推荐了PyCharm,那一会儿就试试pycharm远程开发吧

 接下来打nv驱动

Cuda Toolkit,pytorch要互相兼容

由于显卡比较老,经学长建议我决定安装历史版本Pytorch1.5.1,此版本Pytorch支持的最高Cuda版本为10.2

wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run

 

 遇到报错“Failed to verify gcc version. See log at /var/log/cuda-installer.log for details.”

由此nv官网找到此CUDA ToolKit对应gcc版本:::

(没写20.04支持啥版本啊不会以后还得回滚Ubuntu18吧。。。

那就装个最新的试试(god bless me

sudo reboot

不知道哪个Ubuntu版本开始有[A start job is running for Wait for Network to be configured]

先处理掉这个问题

sudo nano /lib/systemd/system/systemd-networkd-wait-online.service

[service]下加

TimeoutStartSec=2sec

(方法源Ubuntu18.4 开机卡“A start job is running for wait for network to be Configured”的解决方法_baidu_19452317的博客-CSDN博客

继续安装cuda toolkit

sudo sh cuda_10.2.89_440.33.01_linux.run

 不行啊真得旧GCC

 接下来想办法安装GCC7.3.0

 

整不会了

回去装Cuda11.1去

下载

 enter

不行啊出错了,那我还原之前的办法先打一个driver

懂了没屏蔽Nouveau

干掉Nouveau安装Linux Nvidia显卡驱动_chengde6896383的专栏-CSDN博客_nouveau

 (再试一下直接装CudaToolkit

不行,装驱动吧

(使用sudo apt --fix-broken install好像把gcc7补全了,再试试cuda10.2(不行啊gcc7还是不能用

sudo sh NVIDIA-Linux-x86_64-470.57.02.run :success(忘截图了

接下来是11.1的CudaToolKit

好漫长...

好折磨......

YEAH!

设置环境变量

alice@foundation:~$ sudo nano /etc/ld.so.conf
alice@foundation:~$ sudo ldconfig
alice@foundation:~$ export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64
alice@foundation:~$ export PATH=$PATH:/usr/local/cuda-11.1/bin
alice@foundation:~$ export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.1

 Cuda Toolkit安装到此结束

cudnn日后再说

接下来安装Pytorch

使用conda命令新建环境

我Anaconda呢???

离谱啊我又开始重装了

((啊没配置环境变量QWQ

(((安装的时候用sudo给我默认安装到root文件夹下了

重装回home

配置环境变量:Linux下安装Anaconda3详细教程_奈斯菟咪踢呦-CSDN博客_linux安装anaconda3的步骤

 conda新建环境:conda创建python环境 - 简书

alice@foundation:~$ conda create -n pytorch
Collecting package metadata (current_repodata.json): done
Solving environment: done


==> WARNING: A newer version of conda exists. <==
  current version: 4.10.1
  latest version: 4.10.3

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /home/alice/anaconda3/envs/pytorch



Proceed ([y]/n)? y

Preparing transaction: done
Verifying transaction: done
Executing transaction: done
#
# To activate this environment, use
#
#     $ conda activate pytorch
#
# To deactivate an active environment, use
#
#     $ conda deactivate
alice@foundation:~$ conda activate pytorch
(pytorch) alice@foundation:~$

conda换源:conda换源 - 知乎

Pytorch官网:Start Locally | PyTorch

NOTE: 'nvidia' channel is required for cudatoolkit 11.1
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia

SSH上的screen还没部署,用KVM跑吧明早看结果

Good Night 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/303584.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号