3 个月前

BoxMask:重新审视用于视频目标检测的边界框监督

BoxMask:重新审视用于视频目标检测的边界框监督

摘要

我们提出了一种新颖、简洁 yet 高效的视频目标检测提升方法。我们观察到,以往的工作主要基于实例级别的特征聚合,不可避免地忽略了精细化的像素级表征,从而导致在外观或运动特征相似的对象之间产生混淆。为解决这一局限性,我们提出了BoxMask方法,通过引入类别感知的像素级信息,有效学习具有区分性的特征表示。我们简单地将边界框级标注视为每个目标的粗粒度掩码,用以监督模型训练。所提出的模块可无缝集成至任意基于区域的检测器中,显著提升检测性能。在ImageNet VID和EPIC KITCHENS数据集上的大量实验表明,将BoxMask模块引入多种近期先进的主流方法后,均取得了持续且显著的性能提升。

基准测试

基准方法指标
video-object-detection-on-imagenet-vidBoxMask (ResNet-50)
MAP : 80.7
video-object-detection-on-imagenet-vidBoxMask(ResNeXt101)
MAP : 84.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
BoxMask:重新审视用于视频目标检测的边界框监督 | 论文 | HyperAI超神经