Yolov3 训练自己的数据集

1. 标注工具

1）标注工具：Lableimg

Lableimg软件（windows版本）下载链接：

https://pan.baidu.com/s/1tuIQmuyedRHP1WeGVVSx_Q 提取：ejgx

2）给数据集图像按编号顺序命名：如000001.jpg – 000999.jpg;

3）标注数据：如：图像0000001.jpg, 生成对应的label为000001.xml文件；

2. 利用VOC制作自己的数据集

在目录下新建VOC2007，并在VOC2007下新建Annotations，ImageSets和JPEGImages三个文件夹。在ImageSets下新建Main文件夹

将自己的数据集图片拷贝到JPEGImages目录下。将数据集label文件拷贝到Annotations目录下。在VOC2007下新建test.py文件夹，将下面代码拷贝进去运行，将生成四个文件：train.txt,val.txt,test.txt和trainval.txt。

test.py

 1 import os
 2 import random
 3 
 4 trainval_percent = 0.1
 5 train_percent = 0.9
 6 xmlfilepath = 'Annotations'
 7 txtsavepath = 'ImageSetsMain'
 8 total_xml = os.listdir(xmlfilepath)
 9 
10 num = len(total_xml)
11 list = range(num)
12 tv = int(num * trainval_percent)
13 tr = int(tv * train_percent)
14 trainval = random.sample(list, tv)
15 train = random.sample(trainval, tr)
16 
17 ftrainval = open('ImageSets/Main/trainval.txt', 'w')
18 ftest = open('ImageSets/Main/test.txt', 'w')
19 ftrain = open('ImageSets/Main/train.txt', 'w')
20 fval = open('ImageSets/Main/val.txt', 'w')
21 
22 for i in list:
23     name = total_xml[i][:-4] + '
'
24     if i in trainval:
25         ftrainval.write(name)
26         if i in train:
27             ftest.write(name)
28         else:
29             fval.write(name)
30     else:
31         ftrain.write(name)
32 
33 ftrainval.close()
34 ftrain.close()
35 fval.close()
36 ftest.close()

View Code

生成后的目录结构如下所示：

3. 下载并编译darknet源码

1）下载源码 git clone https://github.com/pjreddie/darknet

2）编译代码：

YOLOV3使用一个开源的神经网络框架Darknet53，使用C和CUDA，有CPU和GPU两种模式。默认使用的是CPU模式，需要切换GPU模型的话，vim修改Makefile文件。

cd darknet

vim Makefile #如果使用CPU模式。则不用修改Makefile文件

注：将前面三行置1，其他不用动

编译： make

编译成功后，可以先下载预训练模型测试一下效果：

wget https://pjreddie.com/media/files/yolov3.weights

./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg

3）加入自己的数据集

在代码的darknet目录下新建VOCdevkit文件夹，然后把刚才制作的VOC2007文件夹拷贝到该文件夹下。有的读者可能了解过YOLOV3的label，YOLOV3的label标注的一行五个数分别代表类别（从 0 开始编号）， BoundingBox 中心 X 坐标，中心 Y 坐标，宽，高。这些坐标都是 0～1 的相对坐标。和我们刚才标注的label不同，因此我们需要下面的py文件帮我们转换label。

wget https://pjreddie.com/media/files/voc_label.py

这里需要修改两个地方，sets和classes，classes根据自己需要修改（注：自己的数据集仍然是20类，防止darknet转ncnn测试时识别精度损失过大）。

接下来运行该文件，我们的目录下会生成三个txt文件2007_train.txt,2007_val.txt,2007_test.txt，VOCdevkit下的VOC2007也会多生成一个labels文件夹，下面是真正会使用到的label，点开看发现已经转化成YOLOV3需要的格式了。这时候自己的数据集正式完成。

python voc_label.py

cat 2007_train.txt 2007_val.txt > train.txt

4. 局部修改

1) 修改cfg/voc.data