- 1、安装
- 2、训练
- 训练的代码
- 自定义设置
- 参数解释
- 训练需要注意的地方
- 显卡CUDA_VISIBLE_DEVICES=0
- Git的问题
- log_folder路径的问题
CUDA_VISIBLE_DEVICES=0 python train.py --config=yolact_edge_truck_config
CUDA_VISIBLE_DEVICES=0 nohup python3 -u train.py --config=yolact_edge_truck_config
查看运行结果
cat nohup.out #查看输出文件 tail -n 100 nohup.out #查看 nohup.out 最后100行的日志 tail -n 100 nohup.out |grep "关键字" #输出文件最后100行,含关键字 tail -fn 50 nohup.out #查看nohup.out里面的日志 tail -f nohup.out #前台实时查看nohub.out文件内容 tail -f nohup.out |grep "关键字" #根据关键字查看 ps -x #查看所有正在运行的进程 kill -9 ID #杀死进程自定义设置
参考train参数传入,可选参数有:
–batch_size 批次,根据自己显卡而定;
–save_interval 默认每10000次迭代保存一次权重
–validation_size 默认每5000次迭代验证一次
B:box, C:class, M:mask, S:instance segmentation, T:total
训练需要注意的地方 显卡CUDA_VISIBLE_DEVICES=0必须使用CUDA_VISIBLE_DEVICES=0(这里可以是任何可以利用的序号),否则代码会报错。
Git的问题Train.py中170行左右的地方,有一个import git
如果电脑没有git,则需要将这一部分代码注释
这一部分代码是Tensorboard用于记录训练数据的部分,可以不加上
本来的代码为
parser.add_argument('--log_folder', default='../../logs/',
help='Directory for saving Tensorboard logs')
但是…/…/logs的路径是错误的,因为如果是使用实验室的服务器的话,路径需要再深一些,否则会在根目录下面的文件夹下建立logs,但是服务器都是多人使用的,所以没有权限在这个路径下做读写。所以需要更改路径。
修改为:
parser.add_argument('--log_folder', default='./logs/',
help='Directory for saving Tensorboard logs')
修改之后就会在yolact_edge文件夹下创建logs文件夹保存数据。



