3 个月前

自监督单目场景流估计

自监督单目场景流估计

摘要

场景光流估计在三维环境感知领域正受到越来越多的关注。单目场景光流估计——即从两帧时间上连续的图像中恢复三维结构与三维运动——是一个高度病态的问题,迄今为止尚缺乏有效的实用解决方案。本文提出了一种新颖的单目场景光流方法,在保持实时性能的同时实现了具有竞争力的精度。通过将问题视为逆问题,我们设计了一种单一的卷积神经网络(CNN),能够从经典的光流代价体中同时准确估计深度与三维运动。我们采用基于三维损失函数的自监督学习策略,并引入遮挡推理机制,以有效利用未标注数据。我们对模型设计中的关键选择进行了验证,包括代理损失函数和数据增强方案的设置。所提方法在无监督/自监督学习的单目场景光流任务中达到了当前最优的精度水平,并在光流估计与单目深度估计子任务上也取得了具有竞争力的性能表现。通过半监督微调进一步提升了精度,在实时性方面也展现出良好的应用前景。

代码仓库

visinf/self-mono-sf
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
scene-flow-estimation-on-kitti-2015-sceneSelf-Mono-SF
Runtime (s): 0.09
D1-all: 31.25
D2-all: 34.86
Fl-all: 23.49
SF-all: 47.05
scene-flow-estimation-on-kitti-2015-scene-1Self-Mono-SF
D1-all: 34.02
D2-all: 36.34
Fl-all: 23.54
Runtime (s): 0.09
SF-all: 49.54

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
自监督单目场景流估计 | 论文 | HyperAI超神经