4 个月前

LED2-Net:通过可微分深度渲染实现单目360布局估计

LED2-Net:通过可微分深度渲染实现单目360布局估计

摘要

尽管在房间布局估计方面已经取得了显著进展,但大多数方法主要致力于减少二维像素坐标中的损失,而不是充分利用三维空间中的房间结构。为了在三维空间中重建房间布局,我们将360度布局估计任务定义为预测全景图地平线上的深度问题。具体而言,我们提出了可微深度渲染(Differentiable Depth Rendering)过程,使得从布局到深度预测的转换变得可微分,从而使我们提出的模型能够在利用三维几何信息的同时实现端到端训练,而无需提供真实深度数据。我们的方法在多个360度布局基准数据集上达到了最先进的性能。此外,我们的公式化方法允许在深度数据集上进行预训练步骤,这进一步提高了我们布局估计模型的泛化能力。

代码仓库

fuenwang/LED2-Net
官方
pytorch

基准测试

基准方法指标
3d-room-layouts-from-a-single-rgb-panorama-on-3LED2-Net
3DIoU: 83.77

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
LED2-Net:通过可微分深度渲染实现单目360布局估计 | 论文 | HyperAI超神经