
摘要
三维物体检测近年来因其在机器人、增强现实、自主系统以及图像检索等领域的广泛应用而备受关注。为此,我们推出了Objectron数据集,旨在推动三维物体检测技术的发展,并促进新型研究与应用的兴起,例如三维物体跟踪、视角合成以及更优的三维形状表示。该数据集包含针对九类物体的以物体为中心的短时视频,每段视频均配有姿态标注,共涵盖14,819个标注视频中的400万张标注图像。此外,我们提出了一种新的评估指标——三维交并比(3D Intersection over Union),用于三维物体检测任务的性能评估。通过在该数据集上训练的基础模型,我们展示了该数据集在三维物体检测任务中的实用价值。目前,该数据集及评估代码已公开发布,可访问 http://www.objectron.dev 获取。
代码仓库
google-research-datasets/Objectron
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| monocular-3d-object-detection-on-google | EfficientNetLite + keypoint regressor | AP at 10' Elevation error: 0.8584 AP at 15' Azimuth error: 0.7844 Average Precision at 0.5 3D IoU: 0.6512 MPE: 0.0467 |