
摘要
三维车道检测在车辆路径规划中发挥着至关重要的作用,近年来已成为自动驾驶领域的一个迅速发展的研究课题。以往的研究由于复杂的空间变换和不灵活的三维车道表示而难以实现实际应用。针对这些问题,我们的工作提出了一种高效且稳健的单目三维车道检测方法——BEV-LaneDet,该方法具有三个主要贡献。首先,我们引入了虚拟相机(Virtual Camera),统一了安装在不同车辆上的相机的内外参数,以保证相机之间空间关系的一致性。这可以有效地促进学习过程,因为视觉空间得到了统一。其次,我们提出了一种简单但高效的三维车道表示方法——关键点表示(Key-Points Representation)。该模块更适合表示复杂多样的三维车道结构。最后,我们设计了一个轻量级且适合芯片的空间变换模块——空间变换金字塔(Spatial Transformation Pyramid),用于将多尺度前视特征转换为鸟瞰图特征。实验结果表明,我们的方法在F-Score指标上优于现有的最先进方法,在OpenLane数据集上高出10.6%,在Apollo 3D合成数据集上高出5.9%,并且速度达到每秒185帧。源代码将在https://github.com/gigo-team/bev_lane_det发布。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-lane-detection-on-apollo-synthetic-3d-lane | BEV-LaneDet | F1: 96.9 X error far: 0.242 X error near: 0.016 Z error far: 0.216 Z error near: 0.02 |
| 3d-lane-detection-on-openlane | BEV-LaneDet | Curve: 63.1 Extreme Weather: 53.4 F1 (all): 58.4 FPS (pytorch): 102 Intersection: 50.3 Merge u0026 Split: 53.7 Night: 53.4 Up u0026 Down: 48.7 |