6 个月前

摘要

在深度神经网络中实现高效计算对于实时目标检测至关重要。然而，近年来的性能提升主要依赖于高性能硬件的改进，而非模型参数量与浮点运算量（FLOP）效率的优化。这一趋势在最新的YOLO架构中尤为明显，其设计更侧重于检测速度，而非轻量化。因此，针对微控制器等资源受限环境优化的目标检测模型受到了较少关注。在计算能力受限的设备上，现有解决方案主要依赖SSDLite或低参数量分类器的组合，导致基于YOLO的架构与真正高效的轻量级检测器之间存在显著差距。这引发了一个关键问题：能否设计出在参数量和FLOP效率方面高度优化的模型，同时达到主流YOLO模型的检测精度？为回应这一挑战，本文以MSCOCO数据集作为基准验证集，提出两项关键贡献。首先，我们提出了LeNeck——一种通用的目标检测框架，其推理速度与SSDLite相当，同时显著提升了检测精度并大幅减少了模型参数量。其次，我们提出了LeYOLO，一种专为提升基于YOLO架构计算效率而设计的高效目标检测模型。LeYOLO有效弥合了基于SSDLite的检测器与YOLO模型之间的性能鸿沟，在模型规模上可与MobileNets相媲美，同时保持了高精度。两项贡献均特别适用于移动设备、嵌入式系统及超低功耗设备（包括微控制器），在计算资源受限场景下具备显著优势。

源 PDF