8 个月前

计算机视觉

Philipp Wolters Johannes Gilg Torben Teepe Fabian Herzog Anouar Laouiichi Martin Hofmann Gerhard Rigoll

摘要

近年来，低成本、以视觉为中心的自动驾驶3D感知系统取得了显著进展，逐渐缩小了与昂贵的基于激光雷达（LiDAR）方法之间的差距。然而，要成为完全可靠的替代方案，主要挑战在于提高深度预测的鲁棒性，因为基于摄像头的系统在长距离检测和恶劣光照及天气条件下表现不佳。本文中，我们介绍了一种名为HyDRa的新颖相机-雷达融合架构，用于多种3D感知任务。该架构基于密集鸟瞰图（BEV, Bird's Eye View）架构的原则，引入了一种混合融合方法，在两个不同的表示空间中结合互补的相机和雷达特征的优势。我们的高度关联变换器模块利用已经处于透视视图中的雷达特征，生成更加鲁棒和精确的深度预测。在鸟瞰图中，我们通过雷达加权深度一致性来细化初始稀疏表示。HyDRa在公开的nuScenes数据集上实现了64.2 NDS（+1.8）和58.4 AMOTA（+1.5）的新纪录，达到了相机-雷达融合领域的最新水平。此外，我们新的语义丰富且空间准确的鸟瞰图特征可以直接转换为强大的占用表示，在Occ3D基准测试中以令人印象深刻的3.7 mIoU超越了所有先前基于摄像头的方法。代码和模型可在https://github.com/phi-wol/hydra获取。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

Philipp Wolters Johannes Gilg Torben Teepe Fabian Herzog Anouar Laouiichi Martin Hofmann Gerhard Rigoll

摘要

近年来，低成本、以视觉为中心的自动驾驶3D感知系统取得了显著进展，逐渐缩小了与昂贵的基于激光雷达（LiDAR）方法之间的差距。然而，要成为完全可靠的替代方案，主要挑战在于提高深度预测的鲁棒性，因为基于摄像头的系统在长距离检测和恶劣光照及天气条件下表现不佳。本文中，我们介绍了一种名为HyDRa的新颖相机-雷达融合架构，用于多种3D感知任务。该架构基于密集鸟瞰图（BEV, Bird's Eye View）架构的原则，引入了一种混合融合方法，在两个不同的表示空间中结合互补的相机和雷达特征的优势。我们的高度关联变换器模块利用已经处于透视视图中的雷达特征，生成更加鲁棒和精确的深度预测。在鸟瞰图中，我们通过雷达加权深度一致性来细化初始稀疏表示。HyDRa在公开的nuScenes数据集上实现了64.2 NDS（+1.8）和58.4 AMOTA（+1.5）的新纪录，达到了相机-雷达融合领域的最新水平。此外，我们新的语义丰富且空间准确的鸟瞰图特征可以直接转换为强大的占用表示，在Occ3D基准测试中以令人印象深刻的3.7 mIoU超越了所有先前基于摄像头的方法。代码和模型可在https://github.com/phi-wol/hydra获取。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供