3 个月前

HiP-AD:基于可变形注意力的分层多粒度规划方法在单解码器自动驾驶中的应用

HiP-AD:基于可变形注意力的分层多粒度规划方法在单解码器自动驾驶中的应用

摘要

尽管近年来端到端自动驾驶(E2E-AD)技术取得了显著进展,但在闭环评估中仍存在性能不理想的问题。利用规划信息设计查询以及实现交互的潜力尚未得到充分挖掘。本文提出一种多粒度规划查询表示方法,该方法融合了异构的航点(waypoints),包括空间、时间及驾驶风格航点,并支持多种采样模式。该表示为轨迹预测提供了额外的监督信号,从而提升了对本车(ego vehicle)的精确闭环控制能力。此外,我们显式利用规划轨迹的几何特性,通过可变形注意力机制,基于物理位置高效检索相关的图像特征。结合上述策略,本文提出一种新型端到端自动驾驶框架——HiP-AD,该框架在统一解码器中同时完成感知、预测与规划任务。HiP-AD通过在鸟瞰图(BEV)空间中使规划查询与感知查询进行迭代交互,并动态地从透视视角图像中提取特征,实现了全面的交互建模。实验结果表明,HiP-AD在闭环基准测试Bench2Drive上优于所有现有端到端自动驾驶方法,并在真实世界数据集nuScenes上取得了具有竞争力的性能。

代码仓库

nullmax-vision/hip-ad
官方
GitHub 中提及

基准测试

基准方法指标
bench2drive-on-bench2driveHiP-AD
Driving Score: 86.77

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
HiP-AD:基于可变形注意力的分层多粒度规划方法在单解码器自动驾驶中的应用 | 论文 | HyperAI超神经