4 个月前

PWOC-3D:深度感知遮挡的端到端场景流估计

PWOC-3D:深度感知遮挡的端到端场景流估计

摘要

近年来,卷积神经网络(CNNs)在学习许多计算机视觉任务方面取得了越来越大的成功,包括光流和立体匹配等密集估计问题。然而,这些任务的联合预测,即场景流,传统上一直依赖于基于基本假设的缓慢经典方法,这些方法难以泛化。本文提出的工作通过引入PWOC-3D,一种紧凑的CNN架构,在端到端监督设置下从立体图像序列中预测场景流,高效地克服了这些缺点(在速度和准确性方面)。此外,大运动和遮挡是场景流估计中的众所周知的问题。PWOC-3D采用了专门的设计决策来显式建模这些挑战。在这方面,我们提出了一种新的自监督策略,可以从图像中预测遮挡(无需任何标记的遮挡数据进行学习)。利用这些构造,我们的网络在KITTI基准测试和具有挑战性的FlyingThings3D数据集上取得了具有竞争力的结果。特别是在KITTI上,PWOC-3D在端到端深度学习方法中排名第二,其参数量比表现最佳的方法少48倍。

代码仓库

基准测试

基准方法指标
scene-flow-estimation-on-kitti-2015-scene-1PWOC-3D
D1-all: 5.13
D2-all: 8.46
Fl-all: 12.96
Runtime (s): 0.13
SF-all: 15.69

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PWOC-3D:深度感知遮挡的端到端场景流估计 | 论文 | HyperAI超神经