YOLOv3-model-pruning-人手检测

YOLOv3-model-pruning - 人手检测

计算机视觉库/人脸识别

授权协议: MIT

操作系统: 跨平台

开发语言: Python

软件简介

用 YOLOv3 模型在一个开源的人手检测数据集 oxford
hand 上做人手检测，并在此基础上做模型剪枝。对于该数据集，对
YOLOv3 进行 channel pruning 之后，模型的参数量、模型大小减少 80% ，FLOPs 降低 70%，前向推断的速度可以达到原来的
200%，同时可以保持 mAP 基本不变（ 这个效果只是针对该数据集的，不一定能保证在其他数据集上也有同样的效果
，之后有时间的话会在其他数据集上进行测试）。

环境

Python3.6, Pytorch 1.0及以上

YOLOv3 的实现参考了 eriklindernoren 的 PyTorch-
YOLOv3 ，因此代码的依赖环境也可以参考其
repo

目前部分代码(如prune_utils.py文件)还在修改和完善，最近比较忙，待整理好再发出来

数据集准备

下载数据集，得到压缩文件
将压缩文件解压到 data 目录，得到 hand_dataset 文件夹
在 data 目录下执行 converter.py，生成 images、labels 文件夹和 train.txt、valid.txt 文件。训练集中一共有 4087 张图片，测试集中一共有 821 张图片

正常训练（Baseline）

python train.py --model_def config/yolov3-hand.cfg

剪枝算法介绍

本代码基于论文 Learning Efficient Convolutional Networks Through Network Slimming
(ICCV
2017)
进行改进实现的 channel pruning算法，类似的代码实现还有这个 yolov3-network-
slimming。原始论文中的算法是针对分类模型的，基于 BN 层的 gamma 系数进行剪枝的。本项目用到的剪枝算法不限于 YOLOv3
模型，稍作改进理论上也是可以移植到其他目标检测模型的。

剪枝算法的步骤

进行稀疏化训练

python train.py –model_def config/yolov3-hand.cfg -sr –s 0.01
基于 test_prune.py 文件进行剪枝（通过设定合理的剪枝规则），得到剪枝后的模型
对剪枝后的模型进行微调（本项目对原算法进行了改进，实验过程中发现即使不经过微调也能达到较高的 mAP）

python train.py –model_def config/prune_yolov3-hand.cfg -pre checkpoints/prune_yolov3_ckpt.pth

稀疏训练过程的可视化

所有 BN 的 gamma 系数的五个五分位点随时间的变化图：

经过 10 次迭代后，60%的 gamma 系数已趋向于 0，40 次迭代后 80% 的 gamma 系数已趋向于 0

YOLOv3中第一个 BN 层的 gamma 系数随迭代次数的变化情况：

随着模型的更新，部分 gamma 系数逐步趋向于 0（表明其重要性逐渐削弱），而部分 gamma 系数能够保持其权重（表明其对网络的输出有一定的重要性）

所有 BN 的 gamma 系数的分布随迭代次数的变化：

分布的重心逐渐向 0 靠近，但并没有全部衰减为 0，表明 gamma 系数逐渐变得稀疏

剪枝前后的对比

下图为对部分卷积层进行剪枝前后通道数的变化：

部分卷积层的通道数大幅度减少

剪枝前后指标对比:

	参数数量	模型体积	Flops	前向推断耗时（2070 TI）	mAP
Baseline (416)	61.5M	246.4MB	32.8B	15.0 ms	0.7692
Prune (416)	10.9M	43.6MB	9.6B	7.7 ms	0.7722
Finetune (416)	同上	同上	同上	同上	0.7750

加入稀疏正则项之后，mAP 反而更高了（在实验过程中发现，其实 mAP上下波动 0.02 是正常现象），因此可以认为稀疏训练得到的 mAP
与正常训练几乎一致。将 prune 后得到的模型进行 finetune
并没有明显的提升，因此剪枝三步可以直接简化成两步。剪枝前后模型的参数量、模型大小降为原来的 1/6 ，FLOPs 降为原来的
1/3，前向推断的速度可以达到原来的 2 倍，同时可以保持 mAP 基本不变。
需要明确的是，上面表格中剪枝的效果是只是针对该数据集的，不一定能保证在其他数据集上也有同样的效果

软件首页