3 个月前

YOLOv6:面向工业应用的单阶段目标检测框架

YOLOv6:面向工业应用的单阶段目标检测框架

摘要

多年来,YOLO系列已成为高效目标检测领域公认的行业标准。YOLO社区蓬勃发展,极大地拓展了其在各类硬件平台和丰富应用场景中的实用性。在本技术报告中,我们致力于将YOLO系列的性能推向新高度,以坚定的产业应用导向持续前行。针对真实场景中对速度与精度多样化的需求,我们全面调研了来自工业界与学术界的最新目标检测进展。具体而言,我们深入吸收了近期在网络结构设计、训练策略、测试技术、量化方法及优化手段等方面的创新思想。在此基础上,结合我们的研究思考与工程实践,构建了一套覆盖多种尺度、可直接部署的网络模型,以满足多样化的实际应用需求。在YOLO原作者的大力支持与授权下,我们将其命名为YOLOv6。我们诚挚欢迎广大用户与贡献者共同参与,持续推动该模型的优化与完善。性能方面,YOLOv6-N在NVIDIA Tesla T4 GPU上实现了1234 FPS的吞吐量,同时在COCO数据集上达到35.9%的AP(平均精度);YOLOv6-S在495 FPS的推理速度下取得43.5%的AP,显著优于同规模主流检测器(如YOLOv5-S、YOLOX-S和PPYOLOE-S)。此外,YOLOv6-S的量化版本更实现了43.3%的AP,达到869 FPS的推理速度,刷新了同类模型的性能纪录。在更大规模的YOLOv6-M和YOLOv6-L上,我们也取得了优于同类检测器的精度表现(分别为49.5%和52.3%),同时保持相近的推理速度。我们通过系统性实验对各组件的有效性进行了严谨验证。相关代码已开源,欢迎访问:https://github.com/meituan/YOLOv6。

基准测试

基准方法指标
object-detection-on-coco-oYOLOv6-L6
Average mAP: 32.5
Effective Robustness: 6.73
pedestrian-detection-on-dvtodYOLOv6 (Visible)
mAP: 38.1
pedestrian-detection-on-dvtodYOLOv6 (Thermal)
mAP: 84.4
real-time-object-detection-on-cocoYOLOv6-L6(1280)
FPS (V100, b=1): 26
box AP: 57.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
YOLOv6:面向工业应用的单阶段目标检测框架 | 论文 | HyperAI超神经