3 个月前

BiFuse:通过双投影融合实现单目360度深度估计

BiFuse:通过双投影融合实现单目360度深度估计

摘要

从单目360图像中进行深度估计是一个新兴的研究问题,由于消费级360相机的普及以及其提供全方位环境感知能力,该问题日益受到关注。尽管360度成像技术标准正在迅速发展,本文提出一种模拟人类眼睛周边视觉与中央凹视觉机制的方法,以预测单目360图像的深度图。为此,我们设计了一种双分支神经网络,分别利用两种常见的投影方式:等距柱状投影(equirectangular)和立方体图投影(cubemap)。其中,等距柱状投影能够覆盖完整的视场,但引入了明显的几何畸变;而立方体图投影虽能有效避免畸变,却在立方体各面的边界处产生不连续性。为此,我们提出一种双投影融合机制,并引入可学习的掩码(learnable masks)以动态平衡两种投影所提取的特征图。此外,针对立方体图投影的边界不连续问题,我们进一步提出一种球面填充(spherical padding)策略,有效缓解了各面之间的边界断裂现象。我们在四个全景图像数据集上对所提方法进行了验证,实验结果表明,该方法在深度估计性能上优于现有的先进方法,展现出显著优势。

基准测试

基准方法指标
depth-estimation-on-stanford2d3d-panoramicBiFuse with fusion
RMSE: 0.4142
absolute relative error: 0.1209

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
BiFuse:通过双投影融合实现单目360度深度估计 | 论文 | HyperAI超神经