
摘要
本文中,我们使用单一的基本架构解决了三个不同的计算机视觉任务:深度预测、表面法线估计和语义标注。我们采用了一种多尺度卷积网络,该网络仅通过微小的修改即可轻松适应每个任务,直接从输入图像回归到输出图。我们的方法通过一系列尺度逐步细化预测结果,无需任何超像素或低层次分割即可捕捉到许多图像细节。我们在所有三项任务的基准测试中均达到了最先进的性能。
代码仓库
pixar0407/depth_map
pytorch
GitHub 中提及
vinceecws/SegNet_PyTorch
pytorch
GitHub 中提及
yhlleo/DeepSegmentor
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| monocular-depth-estimation-on-nyu-depth-v2 | Eigen et al. | RMSE: 0.641 |