17 天前

从视频中无监督学习深度与自身运动

从视频中无监督学习深度与自身运动

摘要

我们提出了一种无监督学习框架,用于从非结构化视频序列中估计单目深度与相机运动。该方法通过将视图合成任务作为监督信号,同时训练深度估计网络与相机位姿估计网络,从而使两个网络在训练过程中通过视图合成目标相互耦合,但在测试阶段可独立使用。在KITTI数据集上的实验评估表明,该方法具有显著有效性:1)单目深度估计性能可与依赖真实位姿或真实深度进行训练的监督方法相媲美;2)在相似输入条件下,位姿估计性能优于现有的主流SLAM系统。

基准测试

基准方法指标
camera-pose-estimation-on-kitti-odometrySfMLearner
Absolute Trajectory Error [m]: 72.57
Average Rotational Error er[%]: 12.26
Average Translational Error et[%]: 29.78

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从视频中无监督学习深度与自身运动 | 论文 | HyperAI超神经