4 个月前

隐式运动处理在视频伪装目标检测中的应用

隐式运动处理在视频伪装目标检测中的应用

摘要

我们提出了一种新的视频伪装物体检测(VCOD)框架,该框架能够利用短期动态和长期时间一致性来从视频帧中检测伪装物体。伪装物体的一个基本特性是它们通常表现出与背景相似的模式,因此在静态图像中很难识别。因此,有效处理视频中的时间动态成为VCOD任务的关键,因为当伪装物体移动时会变得明显。然而,现有的VCOD方法通常利用单应性或光流来表示运动,这可能导致由于运动估计误差和分割误差而累积的检测误差。相比之下,我们的方法在一个统一的优化框架内结合了运动估计和物体分割。具体而言,我们构建了一个密集的相关体积图,以隐式捕获相邻帧之间的运动,并利用最终的分割监督来联合优化隐式运动估计和分割。此外,为了在视频序列中强制执行时间一致性,我们共同利用了一个时空变换器来改进短期预测。我们在多个VCOD基准数据集上进行了广泛的实验,证明了我们方法的架构有效性。我们还提供了一个名为MoCA-Mask的大规模VCOD数据集,其中包含像素级别的手工制作真值掩模,并构建了一个综合的VCOD基准测试平台,纳入了先前的方法以促进该领域的研究。数据集链接:https://xueliancheng.github.io/SLT-Net-project.

代码仓库

xueliancheng/slt-net
pytorch
GitHub 中提及

基准测试

基准方法指标
camouflaged-object-segmentation-onSTL-Net-LT-PVTv2-B5
MAE: 0.030
S-measure: 0.696
mDice: 0.493
mIoU: 0.402
weighted F-measure: 0.481
camouflaged-object-segmentation-on-moca-maskSTL-Net-LT-PVTv2-B5
MAE: 0.027
S-measure: 0.631
mDice: 0.360
mIoU: 0.272
weighted F-measure: 0.311

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
隐式运动处理在视频伪装目标检测中的应用 | 论文 | HyperAI超神经