8 个月前

计算机视觉

Carles Ventura Miriam Bellver Andreu Girbau Amaia Salvador Ferran Marques Xavier Giro-i-Nieto

摘要

多目标视频对象分割是一项具有挑战性的任务，特别是在零样本情况下，即在初始帧中没有提供任何对象掩码，模型需要在序列中找到要分割的对象。在我们的研究工作中，我们提出了一种完全端到端可训练的递归网络用于多目标视频对象分割（RVOS）。我们的模型在两个不同的域中引入了递归机制：(i) 空间域，这使得模型能够在单个帧内发现不同的对象实例；(ii) 时间域，这使得模型能够保持分割对象在时间上的连贯性。我们在零样本视频对象分割任务上对 RVOS 进行了训练，并首次报告了 DAVIS-2017 和 YouTube-VOS 基准测试的定量结果。此外，我们通过使用前一时间步获得的掩码作为递归模块的输入，将 RVOS 适应于单样本视频对象分割任务。我们的模型在 YouTube-VOS 基准测试中达到了与现有最先进技术相当的结果，并且在 DAVIS-2017 基准测试中超越了所有不使用在线学习的先前视频对象分割方法。此外，我们的模型实现了比先前方法更快的推理运行时间，在 P100 GPU 上达到了每帧 44 毫秒的速度。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

Carles Ventura Miriam Bellver Andreu Girbau Amaia Salvador Ferran Marques Xavier Giro-i-Nieto

摘要

多目标视频对象分割是一项具有挑战性的任务，特别是在零样本情况下，即在初始帧中没有提供任何对象掩码，模型需要在序列中找到要分割的对象。在我们的研究工作中，我们提出了一种完全端到端可训练的递归网络用于多目标视频对象分割（RVOS）。我们的模型在两个不同的域中引入了递归机制：(i) 空间域，这使得模型能够在单个帧内发现不同的对象实例；(ii) 时间域，这使得模型能够保持分割对象在时间上的连贯性。我们在零样本视频对象分割任务上对 RVOS 进行了训练，并首次报告了 DAVIS-2017 和 YouTube-VOS 基准测试的定量结果。此外，我们通过使用前一时间步获得的掩码作为递归模块的输入，将 RVOS 适应于单样本视频对象分割任务。我们的模型在 YouTube-VOS 基准测试中达到了与现有最先进技术相当的结果，并且在 DAVIS-2017 基准测试中超越了所有不使用在线学习的先前视频对象分割方法。此外，我们的模型实现了比先前方法更快的推理运行时间，在 P100 GPU 上达到了每帧 44 毫秒的速度。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供