3 个月前

BEVDet4D:在多相机3D目标检测中利用时序线索

BEVDet4D:在多相机3D目标检测中利用时序线索

摘要

单帧数据所包含的信息是有限的,这限制了现有基于视觉的多相机三维目标检测范式的表现。为了从根本上突破该领域的性能瓶颈,本文提出了一种名为BEVDet4D的新范式,将原有的可扩展BEVDet框架从仅限空间维度的三维空间拓展至时空四维空间。通过对原始BEVDet框架进行少量改进,仅需融合前一帧与当前帧对应的特征信息,即可实现对时序线索的有效利用。在此机制下,BEVDet4D在几乎不增加计算开销的前提下,通过查询与对比两个候选特征,成功引入了时间维度的信息。此外,我们通过从学习目标中去除自车运动(ego-motion)和时间因素,显著简化了速度预测任务。实验结果表明,BEVDet4D在具备强泛化能力的同时,将速度预测误差降低了高达62.9%。这使得基于视觉的方法首次在该任务上达到与依赖激光雷达(LiDAR)或雷达(radar)的方法相媲美的水平。在挑战性基准数据集nuScenes上,采用高性能配置的BEVDet4D-Base取得了54.5%的NDS(NuScenes Detection Score)新纪录,相较此前最优方法BEVDet-Base提升了7.3% NDS。相关源代码已公开,供后续研究使用,地址为:https://github.com/HuangJunJie2017/BEVDet。

代码仓库

HuangJunJie2017/BEVDet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-object-detection-on-nuscenesBEVDet4D
NDS: 0.569
mAAE: 0.121
mAOE: 0.386
mAP: 0.451
mASE: 0.241
mATE: 0.511
mAVE: 0.301
3d-object-detection-on-nuscenes-camera-onlyBEVDet4D
Future Frame: false
NDS: 56.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
BEVDet4D:在多相机3D目标检测中利用时序线索 | 论文 | HyperAI超神经