4 个月前

视频对象分割的全双工策略

视频对象分割的全双工策略

摘要

以往的视频对象分割方法主要集中在外观和运动之间的单一解决方案上,这限制了这两个线索之间及内部特征协作的效率。在本研究中,我们提出了一种新颖且高效的全双工策略网络(FSNet),通过在融合和解码阶段利用跨模态特征时考虑更好的运动与外观之间的相互约束方案来解决这一问题。具体而言,我们引入了关系交叉注意力模块(RCAM)以实现嵌入子空间之间的双向消息传播。为了提高模型的鲁棒性和更新时空嵌入中的不一致特征,我们在RCAM之后采用了双向净化模块(BPM)。在五个流行的基准数据集上的大量实验表明,我们的FSNet对各种具有挑战性的场景(如运动模糊、遮挡)具有较强的鲁棒性,并在视频对象分割和视频显著对象检测任务中表现出优于现有最先进方法的性能。该项目已公开发布,地址为:https://dpfan.net/FSNet。

代码仓库

GewelsJI/FSNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
unsupervised-video-object-segmentation-on-10FSNet
F: 83.1
G: 83.3
J: 83.4
video-polyp-segmentation-on-sun-seg-easyFSNet
Dice: 0.702
S measure: 0.725
Sensitivity: 0.493
mean E-measure: 0.695
mean F-measure: 0.630
weighted F-measure: 0.551
video-polyp-segmentation-on-sun-seg-hardFSNet
Dice: 0.699
S-Measure: 0.724
Sensitivity: 0.491
mean E-measure: 0.694
mean F-measure: 0.611
weighted F-measure: 0.541

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
视频对象分割的全双工策略 | 论文 | HyperAI超神经