栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 系统运维 > 运维 > Linux

终端远程服务器一些事项

Linux 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

终端远程服务器一些事项

深度学习训练场景常常使用服务器集群实现,终端连接远程服务器长时间训练任务时由于网络波动等原因会断开连接,此时训练任务被中断,且前台打印信息丢失,原因是终端接收HUP信号关闭子进程,解决方法:

1. nohup命令让终端忽略HUP信号:

nohup python3 -u train.py 再加&可转入后台,此时生成.out文件打印训练信息。

2. setsid命令以该命令运行的进程父进程不属于该终端:

setsid python3 -u train.py > info.txt打印信息存放在info.txt中。

训练过程需要中断时需要关闭后台进程实现:

1. ps -aux查看所有进程

2. 找到对应任务PID

3. kill -15 PID 或 kill -9 PID关闭进程,一般用-15,通俗来说:让程序“安全干净退出”,即执行资源释放等准备工作。 -9为强制终止。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/756852.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号