
摘要
本文探讨了从单张静态图像中进行深度估计的问题。受近期多尺度卷积神经网络(CNN)研究的启发,我们提出了一种深度模型,该模型融合了来自多个CNN侧输出的互补信息。与以往方法不同的是,本研究通过连续条件随机场(CRFs)实现了信息的整合。具体而言,我们提出了两种不同的变体:一种基于多个CRFs的级联,另一种则基于统一的图模型。通过设计一种新颖的连续CRFs的CNN均值场更新实现方法,我们证明了所提出的两种模型均可被视为顺序深度网络,并且可以进行端到端训练。通过广泛的实验评估,我们展示了该方法的有效性,并在公开数据集上建立了新的最先进结果。
代码仓库
xuyingyue/DeepUnifiedCRF_iccv19
caffe2
GitHub 中提及
danxuhk/ContinuousCRF-CNN
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| depth-estimation-on-nyu-depth-v2 | MS-CRF | RMS: 0.586 |
| monocular-depth-estimation-on-nyu-depth-v2 | Xu et al. | RMSE: 0.586 |