3 个月前

UniFuse:单向融合用于360°全景深度估计

UniFuse:单向融合用于360°全景深度估计

摘要

从球面全景图中学习深度信息正逐渐成为一项热门研究课题,因为全景图能够提供环境的完整视场(full field-of-view),并相对完整地描述场景。然而,将针对透视图像广泛研究的卷积神经网络(CNN)直接应用于球面全景图的标准表示形式——等距柱状投影(equirectangular projection)时,效果并不理想,因为该投影在两极附近会产生显著的几何畸变。另一种替代方案是立方体图投影(cubemap projection),其无畸变,但在边缘处存在不连续性,且视场范围受限。本文提出了一种新的融合框架,旨在结合两种投影的优势:仅在解码阶段单向地将立方体图特征馈入等距柱状投影特征。与近期在编码和解码阶段均进行双向融合的方法相比,我们的融合策略具有更高的计算效率。此外,我们还设计了一种更为有效的融合模块以适配该单向融合机制。实验结果验证了所提出融合策略与模块的有效性,所提模型在四个主流数据集上均取得了当前最优的性能表现。进一步的实验表明,该模型在模型复杂度和泛化能力方面也具备显著优势。代码已开源,地址为:https://github.com/alibaba/UniFuse-Unidirectional-Fusion。

代码仓库

alibaba/UniFuse-Unidirectional-Fusion
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
depth-estimation-on-matterport3dUniFuse
Abs Rel: 0.1063
depth-estimation-on-stanford2d3d-panoramicUniFuse with fusion
RMSE: 0.3691
absolute relative error: 0.1114

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
UniFuse:单向融合用于360°全景深度估计 | 论文 | HyperAI超神经