3 个月前

PETR:用于多视角 3D 目标检测的位置嵌入转换

PETR:用于多视角 3D 目标检测的位置嵌入转换

摘要

本文提出了一种用于多视角三维目标检测的位置嵌入转换方法(Position Embedding Transformation, PETR)。PETR 将三维坐标的位置信息编码至图像特征中,生成具备三维位置感知能力的特征表示。通过该特征,对象查询(object query)能够感知三维位置信息,从而实现端到端的三维目标检测。在标准的 nuScenes 数据集上,PETR 取得了当前最优的性能表现(NDS 达到 50.4%,mAP 达到 44.1%),并在该基准测试中位列第一。该方法可作为未来研究中一个简洁而强大的基线模型。代码已开源,地址为:\url{https://github.com/megvii-research/PETR}。

代码仓库

megvii-research/petr
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-object-detection-on-3d-object-detection-onPETR
Average mAP: 17.6
3d-object-detection-on-truckscenesPETR
NDS: 12.1
mAP: 2.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PETR:用于多视角 3D 目标检测的位置嵌入转换 | 论文 | HyperAI超神经