4 个月前

从静态图像中学习视频对象分割

从静态图像中学习视频对象分割

摘要

受近期深度学习在实例分割和目标跟踪方面取得的进展启发,我们引入了视频对象分割问题作为引导实例分割的概念。我们的模型以逐帧的方式进行处理,由前一帧的输出引导,指向下一帧中的感兴趣对象。我们证明了仅使用静态图像训练的卷积神经网络(convnet)可以实现视频中高精度的对象分割。我们方法的关键在于离线和在线学习策略的结合,前者用于从前一帧估计结果中生成更精细的掩模,后者则允许捕捉特定对象实例的外观特征。我们的方法可以处理不同类型的输入注释:边界框和分割区域,同时还可以整合多个已标注的帧,使得该系统适用于多种应用场景。我们在三个不同的数据集上获得了具有竞争力的结果,这些结果独立于输入注释的类型。

代码仓库

birdman9390/MetaMaskTrack
pytorch
GitHub 中提及
omkar13/MaskTrack
pytorch
GitHub 中提及

基准测试

基准方法指标
video-object-segmentation-on-youtubeMaskTrack
mIoU: 0.726
visual-object-tracking-on-davis-2016MSK
F-measure (Decay): 9.0
F-measure (Mean): 75.4
F-measure (Recall): 87.1
Ju0026F: 77.55
Jaccard (Decay): 8.9
Jaccard (Mean): 79.7
Jaccard (Recall): 93.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从静态图像中学习视频对象分割 | 论文 | HyperAI超神经