3 个月前

MSN:用于视频实例分割的高效在线掩码选择网络

MSN:用于视频实例分割的高效在线掩码选择网络

摘要

在本工作中,我们提出了一种面向视频实例分割(Video Instance Segmentation, VIS)的创新解决方案,该方法能够自动生成实例级别的分割掩码,并在视频序列中对目标类别进行识别与跟踪。我们通过引入掩码选择网络(Mask Selection Network, MSN),以在线方式对分割分支与传播分支生成的掩码进行优化,从而有效抑制了掩码跟踪过程中噪声的累积。我们设计了一种基于局部块(patch-based)的卷积神经网络结构来实现MSN,该网络能够精确区分掩码之间细微的差异,并从中准确选择更优的掩码。此外,我们利用时间一致性特性,采用正向与反向双重处理策略作为后处理步骤,以恢复在跟踪过程中丢失的目标。所提出的框架具有良好的通用性,可适配任意现有的视频对象分割方法以完成VIS任务。在2021年YouTube-VIS挑战赛中,我们的方法取得了49.1 mAP的优异成绩,在全球超过30支参赛团队中位列第三。相关代码将公开发布于:https://github.com/SHI-Labs/Mask-Selection-Networks。

基准测试

基准方法指标
video-instance-segmentation-on-youtube-vis-1MSN
AP50: 69.4
AP75: 54.9
AR1: 40.1
AR10: 55.0
mask AP: 48.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MSN:用于视频实例分割的高效在线掩码选择网络 | 论文 | HyperAI超神经