4 个月前

摘要

我们提出了一种无监督学习框架，用于从非结构化视频序列中估计单目深度与相机运动。该方法通过将视图合成任务作为监督信号，同时训练深度估计网络与相机位姿估计网络，从而使两个网络在训练过程中通过视图合成目标相互耦合，但在测试阶段可独立使用。在KITTI数据集上的实验评估表明，该方法具有显著有效性：1）单目深度估计性能可与依赖真实位姿或真实深度进行训练的监督方法相媲美；2）在相似输入条件下，位姿估计性能优于现有的主流SLAM系统。

源 PDF