4 个月前

一种用于从单个RGB图像估计精细深度图的双流网络

一种用于从单个RGB图像估计精细深度图的双流网络

摘要

从单个RGB图像估计深度是一个病态且本质上具有模糊性的问题。目前最先进的深度学习方法可以估算出准确的2D深度图,但当这些图被投影到3D空间时,它们缺乏局部细节,且经常出现严重失真。我们提出了一种训练速度快的双流卷积神经网络(CNN),该网络能够预测深度及其梯度,然后将两者融合生成一个准确且详细的深度图。此外,我们定义了一种针对多张图像的新集合损失函数;通过在一组共同的图像之间进行正则化估计,网络减少了过拟合的风险,并且比竞争方法实现了更高的精度。在NYU Depth v2数据集上的实验表明,我们的深度预测结果与当前最先进方法相当,并能生成忠实的3D投影。

基准测试

基准方法指标
monocular-depth-estimation-on-nyu-depth-v2Li et al.
RMSE: 0.635

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种用于从单个RGB图像估计精细深度图的双流网络 | 论文 | HyperAI超神经