3 个月前

用于视频显著目标检测的动态上下文感知过滤网络

用于视频显著目标检测的动态上下文感知过滤网络

摘要

捕捉帧间动态变化的能力对于视频显著性目标检测(VSOD)的发展至关重要。尽管已有大量研究在此领域取得了显著成果,但对视频动态特性的深层次理解仍有待深入。本文旨在回答以下两个关键问题:模型如何自适应地应对动态变化,并在真实环境中感知细微差异?时空动态信息如何在时间维度上有效融入空间特征中?为此,我们提出了一种动态上下文感知滤波网络(DCFNet),其核心包含一个动态上下文感知滤波模块(DCFM)以及一种高效的双向动态融合策略。所提出的DCFM通过提取连续帧之间的位置相关性,为动态滤波器的生成提供了新思路;而双向动态融合策略则以动态方式促进空间与时间信息之间的交互。实验结果表明,所提方法在多数VSOD数据集上均达到了当前最优性能,同时保持了28帧/秒的实时处理速度。项目源代码已公开,可访问 https://github.com/OIPLab-DUT/DCFNet 获取。

基准测试

基准方法指标
video-polyp-segmentation-on-sun-seg-easyDCF
Dice: 0.325
S measure: 0.523
Sensitivity: 0.340
mean E-measure: 0.514
mean F-measure: 0.312
weighted F-measure: 0.270
video-polyp-segmentation-on-sun-seg-hardDCF
Dice: 0.317
S-Measure: 0.514
Sensitivity: 0.364
mean E-measure: 0.522
mean F-measure: 0.303
weighted F-measure: 0.263

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于视频显著目标检测的动态上下文感知过滤网络 | 论文 | HyperAI超神经