
摘要
本文旨在自动驾驶场景下生成高质量的3D物体候选区域。我们的方法利用双目视觉图像,将候选区域以3D边界框的形式进行定位。我们将该问题建模为最小化一个能量函数,该函数融合了物体尺寸先验、地面平面约束,以及若干基于深度信息的特征,用于推理自由空间分布、点云密度以及与地面的距离。实验结果表明,在具有挑战性的KITTI基准测试上,我们的方法在性能上显著优于现有的RGB与RGB-D物体候选区域生成方法。结合卷积神经网络(CNN)进行评分后,我们的方法在KITTI数据集的全部三个物体类别上均超越了所有现有方法的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| vehicle-pose-estimation-on-kitti-cars-hard | 3DOP | Average Orientation Similarity: 76.52 |