Guanghua YuQinyao ChangWenyu LvChang XuCheng CuiWei JiQingqing DangKaipeng DengGuanzhong WangYuning DuBaohua LaiQiwen LiuXiaoguang HuDianhai YuYanjun Ma

摘要
在目标检测领域,精度与效率之间的权衡始终是一个具有挑战性的问题。本文致力于研究目标检测中的关键优化方法与神经网络架构设计,以提升模型的精度与效率。我们探讨了无锚框(anchor-free)策略在轻量级目标检测模型中的适用性,通过改进主干网络结构并设计轻量化颈部结构,显著增强了网络的特征提取能力。同时,我们优化了标签分配策略与损失函数,使训练过程更加稳定高效。基于上述改进,我们提出了一类全新的实时目标检测模型家族——PP-PicoDet,该系列模型在移动端目标检测任务中表现出卓越性能。相较于现有主流模型,PP-PicoDet在精度与延迟之间实现了更优的平衡。其中,PicoDet-S 模型仅包含 0.99M 参数,在输入尺寸为 320 时,达到 30.6% 的 mAP,相比 YOLOX-Nano 实现了绝对提升 4.8% 的 mAP,同时将移动端 CPU 推理延迟降低 55%;相较于 NanoDet,mAP 提升达 7.1%。在移动端 ARM CPU 上,其推理速度可达 123 FPS(使用 Paddle Lite 时可达 150 FPS)。PicoDet-L 模型仅需 3.3M 参数,即可达到 40.9% 的 mAP,相比 YOLOv5s 实现了绝对 3.7% 的 mAP 提升,且推理速度提升 44%。如图1所示,我们的模型在轻量级目标检测任务中显著优于当前最先进的方法。相关代码与预训练模型已开源,详见:https://github.com/PaddlePaddle/PaddleDetection。
代码仓库
PaddlePaddle/PaddleDetection
官方
paddle
GitHub 中提及
developer0hye/PicoDet-Backbone
pytorch
GitHub 中提及
umitkacar/ai-edge-computing
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-mscoco-6 | PP-PicoDet-L | mAP @0.5:0.95: 40.9 |