3 个月前

基于流引导的循环神经编码器用于视频显著目标检测

基于流引导的循环神经编码器用于视频显著目标检测

摘要

近年来,得益于深度卷积神经网络的发展,图像显著性检测取得了显著进展。然而,将最先进的图像显著性检测方法拓展至视频领域仍面临挑战。视频中物体或相机的运动,以及外观对比度的剧烈变化,严重制约了显著目标检测的性能。本文提出了一种名为光流引导的循环神经编码器(Flow Guided Recurrent Neural Encoder, FGRNE)的精确且端到端学习框架,用于视频显著目标检测。该框架通过融合两方面信息来增强帧间特征的时序一致性:一是基于光流的运动信息,二是基于LSTM网络的序列特征演化编码。FGRNE可被视为一种通用框架,能够将任意基于全卷积网络(FCN)的静态图像显著性检测器无缝扩展至视频显著目标检测任务。大量实验结果验证了FGRNE各组成部分的有效性,并证实所提出方法在DAVIS和FBMS等公开基准数据集上的性能显著优于当前最先进的方法。

基准测试

基准方法指标
video-salient-object-detection-on-davis-2016FGRN
AVERAGE MAE: 0.043
MAX E-MEASURE: 0.917
MAX F-MEASURE: 0.783
S-Measure: 0.838
video-salient-object-detection-on-davsodFGRN
Average MAE: 0.095
S-Measure: 0.701
max E-Measure: 0.765
max F-Measure: 0.589
video-salient-object-detection-on-davsod-1FGRN
Average MAE: 0.126
S-Measure: 0.638
max E-measure: 0.700
video-salient-object-detection-on-davsod-2FGRN
Average MAE: 0.131
S-Measure: 0.608
max E-measure: 0.698
video-salient-object-detection-on-fbms-59FGRN
AVERAGE MAE: 0.088
MAX E-MEASURE: 0.863
MAX F-MEASURE: 0.767
S-Measure: 0.809
video-salient-object-detection-on-mclFGRN
AVERAGE MAE: 0.044
MAX E-MEASURE: 0.817
MAX F-MEASURE: 0.625
S-Measure: 0.709
video-salient-object-detection-on-uvsdFGRN
Average MAE: 0.042
S-Measure: 0.745
max E-measure: 0.887
video-salient-object-detection-on-visalFGRN
Average MAE: 0.045
S-Measure: 0.861
max E-measure: 0.945
video-salient-object-detection-on-vos-tFGRN
Average MAE: 0.097
S-Measure: 0.715
max E-measure: 0.797

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于流引导的循环神经编码器用于视频显著目标检测 | 论文 | HyperAI超神经