
摘要
我们提出了一种新颖的引导交互分割(GIS)算法,用于视频对象的分割,以提高分割精度并减少交互时间。首先,我们设计了基于可靠性的注意力模块,用于分析多个标注帧的可靠性。其次,我们开发了交集感知传播模块,将分割结果传播到相邻帧。最后,我们引入了GIS机制,使用户能够以较少的努力快速选择不满意帧。实验结果表明,所提出的算法在速度更快的情况下提供了比传统算法更准确的分割结果。代码可在 https://github.com/yuk6heo/GIS-RAmap 获取。
代码仓库
yuk6heo/GIS-RAmap
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| interactive-video-object-segmentation-on | GIS | AUC-J: 0.820 AUC-Ju0026F: 0.856 Ju0026F@60s: 0.866 J@60s: 0.829 |