
摘要
在许多实际应用中,如自动驾驶和机器人导航,稳健的几何和语义场景理解变得越来越重要。本文提出了一种基于多任务学习的方法,能够同时进行几何和语义场景理解,具体包括深度预测(单目深度估计和深度补全)和语义场景分割。在单一的时间约束递归网络中,我们的方法独特地利用了一系列复杂的跳跃连接、对抗训练以及连续帧的时间约束,以同时生成一致的深度和语义类别标签。广泛的实验评估表明,与当前其他最先进的技术相比,我们的方法具有更高的有效性。
代码仓库
atapour/temporal-depth-segmentation
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| monocular-depth-estimation-on-kitti-eigen | VDA | absolute relative error: 0.193 |