
摘要
我们如何整合来自互补传感器的表示以实现自动驾驶?基于几何的融合在感知任务(如物体检测、运动预测)中显示出潜力。然而,在端到端驾驶的背景下,我们发现现有的传感器融合方法在动态代理密度较高的复杂驾驶场景中表现不佳。因此,我们提出了 TransFuser,一种利用自注意力机制整合图像和激光雷达(LiDAR)表示的方法。我们的方法在多个分辨率下使用变压器模块来融合透视图和俯视图特征图。我们在一个具有长路线和密集交通的新基准测试以及 CARLA 城市驾驶模拟器的官方排行榜上进行了实验验证,证明了其有效性。提交时,TransFuser 在 CARLA 排行榜上的驾驶评分大幅领先于所有先前的工作。与基于几何的融合相比,TransFuser 将每公里平均碰撞次数减少了 48%。
代码仓库
autonomousvision/transfuser
官方
pytorch
GitHub 中提及
autonomousvision/navsim
GitHub 中提及
pagand/e2etransfuser
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| autonomous-driving-on-carla-leaderboard | TransFuser | Driving Score: 61.181 Infraction penalty: 0.714 Route Completion: 86.694 |
| autonomous-driving-on-carla-leaderboard | TransFuser (Reproduced) | Driving Score: 55.04 Infraction penalty: 0.63 Route Completion: 89.65 |
| autonomous-driving-on-carla-leaderboard | Latent TransFuser | Driving Score: 45.20 Infraction penalty: 0.72 Route Completion: 66.31 |
| carla-longest6-on-carla | Late Fusion (LF) | Driving Score: 22 Infraction Score: 0.27 Route Completion: 83 |
| carla-longest6-on-carla | Geometric Fusion (GF) | Driving Score: 27 Infraction Score: 0.30 Route Completion: 91 |
| carla-longest6-on-carla | TransFuser (TF) | Driving Score: 47 Infraction Score: 0.50 Route Completion: 93 |
| carla-longest6-on-carla | Latent TransFuser (LTF) | Driving Score: 37 Infraction Score: 0.38 Route Completion: 95 |