
摘要
在本报告中,我们对YOLO系列检测器提出了一系列实践经验上的改进,构建出一款高性能的新一代检测器——YOLOX。我们摒弃了传统的基于锚框(anchor-based)的检测方式,转而采用无锚框(anchor-free)架构,并融合多项先进的检测技术,包括解耦头(decoupled head)结构以及当前领先的标签分配策略SimOTA,从而在多个不同规模的模型上均取得了当前最优的检测性能。具体而言:对于参数量仅为0.91M、计算量为1.08G FLOPs的YOLO-Nano模型,在COCO数据集上达到了25.3%的AP,较NanoDet提升了1.8% AP;针对工业界广泛应用的YOLOv3模型,我们通过改进将其在COCO数据集上的AP提升至47.3%,超越当前最优实践3.0% AP;对于参数量与YOLOv4-CSP、YOLOv5-L相当的YOLOX-L模型,在Tesla V100上实现了68.9 FPS的推理速度,并在COCO数据集上达到50.0% AP,较YOLOv5-L高出1.8% AP。此外,我们仅使用单一的YOLOX-L模型,便在CVPR 2021自动驾驶研讨会(Workshop on Autonomous Driving)举办的Streaming Perception Challenge中荣获第一名。我们期望本报告能为实际应用场景中的开发者与研究者提供有价值的参考经验。同时,我们已提供支持ONNX、TensorRT、NCNN和OpenVINO等多种部署框架的版本。源代码已开源,地址为:https://github.com/Megvii-BaseDetection/YOLOX。
代码仓库
pmj110119/yolox
pytorch
GitHub 中提及
qy1994-0919/cfpnet
pytorch
GitHub 中提及
2023-MindSpore-1/ms-code-182
mindspore
GitHub 中提及
jesse01/paddle-yolox
paddle
GitHub 中提及
xiyie/yolox
pytorch
GitHub 中提及
kisna-aryan/YOLOX
pytorch
GitHub 中提及
wangdongdut/dut-anti-uav
GitHub 中提及
pistachio0812/YOLOX
pytorch
GitHub 中提及
apolloauto/apollo-model-yolox
pytorch
GitHub 中提及
open-mmlab/mmdetection
pytorch
2023-MindSpore-1/ms-code-194
mindspore
mszpc/yolox
mindspore
gloria111/YOLOX_paddle
paddle
2023-MindSpore-1/ms-code-191
mindspore
alibaba/EasyCV
pytorch
texasinstruments/edgeai-yolox
pytorch
GitHub 中提及
zhangming8/yolox-pytorch
pytorch
GitHub 中提及
newsun-boki/yolox-openvino-video-infer
pytorch
GitHub 中提及
DataXujing/YOLOX-
pytorch
GitHub 中提及
lazyn1997/YOLOX
paddle
chenyicai-0611/YOLOX-Flask-deployment
pytorch
GitHub 中提及
middleprince/YOLOX-SS
pytorch
GitHub 中提及
Deci-AI/super-gradients
pytorch
GitHub 中提及
Megvii-BaseDetection/YOLOX
官方
pytorch
GitHub 中提及
open-edge-platform/geti
pytorch
GitHub 中提及
NEUAutonomousDriving408/CIVCAutonomousDriving
pytorch
GitHub 中提及
MegEngine/YOLOX
pytorch
GitHub 中提及
newsun-boki/yolovx-openvino-c--video-infer
pytorch
GitHub 中提及
jinsheng124/yolox
pytorch
GitHub 中提及
2023-MindSpore-1/ms-code-31
mindspore
GitHub 中提及
liuyuan000/yolox_sar
pytorch
GitHub 中提及
StephenStorm/YOLOX
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 2d-object-detection-on-ceymo | YOLOX | mAP: 57.7 |
| object-detection-on-coco | YOLOX-Darknet53(Darknet53, 640x640, single-scale) | box mAP: 48.0 |
| object-detection-on-coco | YOLOX-Nano(416x416, single-scale) | Params (M): 0.91 box mAP: 25.8 |
| object-detection-on-coco | YOLOX-Tiny(416x416, single-scale) | Params (M): 5.06 box mAP: 32.8 |
| object-detection-on-coco | YOLOX-x(Modified CSP v5, 640x640, single-scale) | box mAP: 51.5 |
| object-detection-on-coco | YOLOX-X (Modified CSP v5) | AP50: 69.6 AP75: 55.7 APL: 66.1 APM: 56.1 APS: 31.2 Params (M): 99.1 box mAP: 51.2 |
| object-detection-on-coco-o | YOLOX-X | Average mAP: 30.3 Effective Robustness: 7.26 |
| object-detection-on-coco-o | YOLOX-S | Average mAP: 20.6 Effective Robustness: 2.48 |
| object-detection-on-waterscenes | YOLOX-M | mAP@50-95: 57.8 |
| real-time-object-detection-on-argoverse-hd-2 | YOLOX | AP: 47.42 |
| real-time-object-detection-on-argoverse-hd-3 | YOLOX | AP: 41.1 |
| real-time-object-detection-on-argoverse-hd-5 | YOLOX | AP: 41.1 |
| real-time-object-detection-on-coco | YOLOv5-X | FPS (V100, b=1): 62.5 box AP: 50.4 |