3 个月前

CoordiNet:一种面向可靠车辆定位的不确定性感知姿态回归器

CoordiNet:一种面向可靠车辆定位的不确定性感知姿态回归器

摘要

本文研究了面向机器人与自动驾驶车辆应用的基于视觉的相机重定位问题,采用神经网络实现。我们的方法提出了一种基于卷积神经网络(CNN)的算法,能够直接从单张图像中预测相机位姿(包含3D平移与3D旋转),并同时提供位姿的不确定性估计。位姿与不确定性通过单一损失函数联合学习,并在测试阶段利用扩展卡尔曼滤波器(EKF)进行融合。此外,我们提出了一种全新的全卷积网络架构——CoordiNet,旨在显式地嵌入场景几何信息。在目前最大的公开基准数据集Oxford RobotCar上,我们的方法显著优于现有对比方法,平均定位误差降低至8米,而此前最优方法的误差为19米。我们还进一步评估了该方法在大场景下的实时性能(18帧/秒)用于车辆定位。在此场景下,基于结构的方法通常依赖庞大的数据库,而我们的方法展现出可靠的替代优势,在一个1.9公里长、交通繁忙的城市环路中实现了29厘米的中位数定位误差。

基准测试

基准方法指标
camera-localization-on-oxford-robotcar-fullCoordiNet
Mean Translation Error: 14.96
visual-localization-on-oxford-robotcar-fullCoordiNet
Mean Translation Error: 14.96

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CoordiNet:一种面向可靠车辆定位的不确定性感知姿态回归器 | 论文 | HyperAI超神经