Yueming ZhangXiaolin SongBing BaiTengfei XingChao LiuXin GaoZhihui WangYawei WenHaojin LiaoGuoshan ZhangPengfei Xu

摘要
在自动驾驶系统中,从图像中准确识别车辆、行人和自行车是至关重要的任务。除了对预测精度的高要求外,实时运行的需求也给卷积神经网络模型带来了新的挑战。本报告提出一种实时2D目标检测方法,通过融合多种主流的一阶段目标检测器,并独立训练采用不同输入策略的模型,以提升各类目标(尤其是小目标)的多尺度检测精度。为实现模型加速,我们采用TensorRT对检测流水线的推理过程进行优化。如Waymo开放数据集挑战赛实时2D检测赛道的排行榜所示,所提出的检测框架在该赛道中取得了第二名的成绩,L1 mAP达到75.00%,L2 mAP达到69.72%;同时,在Nvidia Tesla V100 GPU上实现了45.8ms/帧的延迟,满足实时性要求。
代码仓库
WongKinYiu/yolor
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-waymo-open-dataset | YOLO_v5 | AP/L2: 64.14 Latency, ms: 3.81 |
| object-detection-on-waymo-open-dataset | LeapMotor_Det | AP/L2: 70.41 Latency, ms: 6.16 |
| object-detection-on-waymo-open-dataset | YOLOR_P6_TRT | AP/L2: 69.56 Latency, ms: 3.74 |
| object-detection-on-waymo-open-dataset | dereyly_self_ensemble | AP/L2: 65.65 Latency, ms: 6.87 |
| object-detection-on-waymo-open-dataset | YOLOR_TensorRT (Ours) | AP/L2: 69.72 Latency, ms: 4.58 |