4 个月前

一种从多车载相机图像到鸟瞰视角语义分割图像的Sim2Real深度学习方法

一种从多车载相机图像到鸟瞰视角语义分割图像的Sim2Real深度学习方法

摘要

准确的环境感知对于自动驾驶至关重要。当使用单目相机时,环境中物体的距离估计是一个主要挑战。如果将相机视角转换为鸟瞰图(BEV),距离估计会变得更加容易。对于平坦表面,逆透视映射(IPM)可以准确地将图像转换为鸟瞰图。然而,车辆和易受伤害的道路使用者等三维物体在这一变换过程中会发生畸变,导致难以估计它们相对于传感器的位置。本文介绍了一种基于多台车载相机获取校正后的360°鸟瞰图的方法。校正后的鸟瞰图被分割为语义类别,并包括对遮挡区域的预测。该神经网络方法不依赖于人工标注的数据,而是通过合成数据集进行训练,以确保其能够很好地泛化到真实世界数据中。通过使用语义分割图像作为输入,我们缩小了模拟数据与真实世界数据之间的现实差距,并证明了我们的方法可以在实际应用中取得成功。在合成数据上进行的广泛实验表明,我们的方法相比IPM具有显著优势。源代码和数据集可在https://github.com/ika-rwth-aachen/Cam2BEV 获取。

代码仓库

ika-rwth-aachen/Cam2BEV
官方
tf
GitHub 中提及

基准测试

基准方法指标
cross-view-image-to-image-translation-on-6uNetXST
Mean IoU: 71.92
semantic-segmentation-on-cam2bevuNetXST
Mean IoU: 71.92

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种从多车载相机图像到鸟瞰视角语义分割图像的Sim2Real深度学习方法 | 论文 | HyperAI超神经