6 个月前

机器视觉 3D

计算机视觉

多任务学习

计算机视觉

Junhwa Hur Stefan Roth

摘要

从一系列单目图像中估计三维场景流（3D scene flow）因其采集设备简单、成本低廉而受到越来越多关注。然而，由于该问题具有严重的病态性（ill-posedness），现有方法的精度受到限制，尤其是高效且支持实时运行的方法。本文提出一种基于自监督学习的多帧单目场景流网络，在保持实时效率的同时显著提升了精度。在先进的两帧基准模型（采用分叉解码器结构）基础上，我们提出了三项关键改进：（i）采用三帧输入并引入卷积长短期记忆网络（convolutional LSTM）连接的多帧建模结构；（ii）设计一种考虑遮挡情况的census损失函数，以提升估计精度；（iii）引入梯度分离策略，增强训练过程的稳定性。在KITTI数据集上的实验结果表明，本方法在基于自监督学习的单目场景流方法中达到了当前最优的精度水平。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

机器视觉 3D

计算机视觉

多任务学习

计算机视觉

Junhwa Hur Stefan Roth

摘要

从一系列单目图像中估计三维场景流（3D scene flow）因其采集设备简单、成本低廉而受到越来越多关注。然而，由于该问题具有严重的病态性（ill-posedness），现有方法的精度受到限制，尤其是高效且支持实时运行的方法。本文提出一种基于自监督学习的多帧单目场景流网络，在保持实时效率的同时显著提升了精度。在先进的两帧基准模型（采用分叉解码器结构）基础上，我们提出了三项关键改进：（i）采用三帧输入并引入卷积长短期记忆网络（convolutional LSTM）连接的多帧建模结构；（ii）设计一种考虑遮挡情况的census损失函数，以提升估计精度；（iii）引入梯度分离策略，增强训练过程的稳定性。在KITTI数据集上的实验结果表明，本方法在基于自监督学习的单目场景流方法中达到了当前最优的精度水平。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供