4 个月前

3DVNet:多视图深度预测与体素精炼

3DVNet:多视图深度预测与体素精炼

摘要

我们提出了一种新的多视图立体(MVS)深度预测方法——3DVNet,该方法结合了先前基于深度和基于体素的MVS方法的优势。我们的核心思想是使用一个三维场景建模网络,该网络迭代更新一组粗略的深度预测值,从而生成与底层场景几何结构高度一致的高精度预测结果。与现有的深度预测技术不同,我们的方法采用了一个在世界空间中对所有深度图进行联合操作的体素化三维卷积神经网络(CNN)。因此,该网络能够学习到有意义的场景级先验知识。此外,与现有的基于体素的MVS技术不同,我们的三维CNN在一个特征增强的点云上运行,这使得多视角信息的有效聚合和深度图的灵活迭代优化成为可能。实验结果显示,在ScanNet数据集上,我们的方法在深度预测和三维重建指标方面均超过了现有最先进水平;同时,在TUM-RGBD和ICL-NUIM数据集中选取的部分场景中也表现优异。这表明我们的方法不仅有效,而且能够很好地适应新环境。

代码仓库

alexrich021/3dvnet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-action-recognition-on-ntu-rgb-d-13DV-PointNet++
Cross Subject Accuracy: 88.8
Cross View Accuracy: 96.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
3DVNet:多视图深度预测与体素精炼 | 论文 | HyperAI超神经