darknet简介darknet 环境准备darknet 训练
darknet简介- darknet官网
(1)比较小众的深度学习框架,没有社区,主要靠作者团队维护优点
(1)易于安装:makefile配置需要的附加项(cuda,cudnn,opencv等)直接make完成安装;
(2)没有任何依赖项:整个框架都用C语言进行编写,可以不依赖任何库
(3)结构明晰,源代码查看、修改方便
[1] src:框架的基础文件
[2] include:框架的头文件
[3] example:定义的检测、分类函数
[4] cfg: 模型的架构,cfg类似 caffe 的prototxt文件, 定义整个模型的架构
[5] data: 放置了一些label文件,含标签配置文件 voc.names.
[6] python: python对模型的调用方法, 基本在darknet.py中
[7] scripts: 脚本,如下载coco数据集,将voc格式的数据集转换为训练所需格式等
(4)友好python接口:直接对训练好的.weight格式的模型进行调用;
(5)易于移植编译文件:darknet程序,libdarknet.a 和 libdarknet.soYOLO V3算法使用的骨干网络是Darknet53
(1)骨干网络是目标检测任务的基本特征提取器,目标检测的主要任务是将图像作为输入并输出相应输入图像的特征图。
(2)大多数用于检测的主干网络是用于分类任务的网络,这些任务连接最后的全连接层。
(3)常用骨干网络:
[1] 更深且连接密集:ResNet,ResNeXt,VGG等
[1] 轻量级:ShuffleNet,MobileNetV2,Xception等
- 开发环境
编译
(1)Makefile默认是关闭GPU,opencv等功能,需修改对应功能的参数值。
(2)make clean && make
- 标签文件:".txt"格式,每行表示一张图像的对象信息,格式为: 数据配置文件:cfg/voc.data
classes = 2 类别的个数 train = /home/alg_test/train_list.txt 训练集的路径 (有对应的标注文件) valid = /home/alg_test/val_list.txt 验证集的路径 names = ./voc.names 类别的名字 backup = ./backup 模型输出
- 网络配置文件:cfg/yolov3.cfg
batch=64 # 一批训练样本的样本数量,每batch个样本更新一次参数,epoch=total/batch=6464/64=101 width=416 # 模型输入尺寸,只可以设置成32的倍数 height=416 # 模型输入尺寸,只可以设置成32的倍数 channels=3 # 灰度图为1,RGB为3 decay=0.0005 # 权重衰减正则项,防止过拟合 max_batches = 20000 # 建议跑200epoch, 101 * 200 = 24200 steps=7070,12120 # 开始衰减的步数,建议70, 120降低一次学习率, 101 * 70 = 7070, 101 * 120 = 12120 learning_rate=0.001 # 有预训练模型建议设置0.001 (如没有0.01) scales=.1,.1 # 每次下降 0.1 (=0.001 * 0.1) # 一共有3对 filters 和 classes 需要修改 [convolutional] size=1 stride=1 pad=1 filters=21 # 3*(classes+1+4) activation=linear [yolo] mask = 0,1,2 anchors = 10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326 classes=2 # 修改yolo的class参数
- 类别信息文件:data/voc.names
person bicycle car motorbike aeroplane
- 预训练模型
(1)[下载地址](wget https://pjreddie.com/media/files/darknet53.conv.74)
(2)训练数据前,可以基于官网提供的预训练权重文件进行训练训练模型
// 单GPU训练 ./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74 // loss-iter曲线, 输出日志重定向到文件内,根据文件内容生成对应的loss-iter曲线 ./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.weights | tee result/log/training.log // 分析训练输出的日志信息, 分析训练参数的修改是否正常,是否需中断重新调整训练参数 // 对应的描述:iter:总损失,平均损失,学习率,花费时间,参与训练的图片总数 1: 629.763611, 629.763611 avg, 0.001000 rate, 6.098687 seconds, 64 images 2: 84.804230, 575.267700 avg, 0.001000 rate, 5.959159 seconds, 128 images
- 模型测试
// 测试单张图片 ./darknet detect voc.data yolov3-voc.cfg yolov3-voc.weights dog.jpg



