3 个月前

UnOVOST:无监督离线视频对象分割与跟踪

UnOVOST:无监督离线视频对象分割与跟踪

摘要

我们研究无监督视频目标分割(Unsupervised Video Object Segmentation, UVOS),即在无需任何关于应追踪目标的先验信息的情况下,自动为视频序列中显著目标生成精确的像素级掩码,并实现这些目标在时间维度上的持续稳定追踪。为解决该任务,我们提出一种简洁且通用的算法——UnOVOST(Unsupervised Offline Video Object Segmentation and Tracking),该算法能够有效追踪并分割多种类型的目标。UnOVOST 采用分阶段建模策略:首先将分割结果聚类为时空一致的短时轨迹片段(tracklets),随后基于视觉相似性将这些短轨迹合并为长期一致的目标轨迹。为实现这一过程,我们引入了一种新型基于轨迹片段的“森林路径切割”(Forest Path Cutting)数据关联算法。该算法先构建一个包含多种轨迹假设的决策森林,再通过切割该森林生成构成长期一致目标轨迹的路径。在 DAVIS 2017 无监督数据集上的实验表明,我们的方法取得了当前最优的性能:在验证集(val)上达到 67.9% 的平均 J&F 分数,在测试开发集(test-dev)上为 58%,在测试挑战集(test-challenge)上为 56.4%,并荣获 DAVIS 2019 无监督视频目标分割挑战赛第一名。值得注意的是,尽管 UnOVOST 完全未接收任何关于目标身份的输入信息,其性能仍可与许多半监督视频目标分割算法相媲美,展现出强大的泛化能力与鲁棒性。

代码仓库

idilesenzulfikar/UNOVOST
pytorch
GitHub 中提及

基准测试

基准方法指标
unsupervised-video-object-segmentation-on-4UnOVOST
F-measure (Mean): 69.3
F-measure (Recall): 76.9
Ju0026F: 67.9
Jaccard (Mean): 66.4
Jaccard (Recall): 76.4
unsupervised-video-object-segmentation-on-5UnOVSOT
F-measure (Decay): 6.6
F-measure (Mean): 62.0
F-measure (Recall): 66.6
Ju0026F: 58.0
Jaccard (Decay): 3.5
Jaccard (Mean): 54.0
Jaccard (Recall): 62.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
UnOVOST:无监督离线视频对象分割与跟踪 | 论文 | HyperAI超神经