6 个月前

摘要

显著性物体检测（Salient Object Detection, SOD）是众多计算机视觉应用中的关键前置任务，近年来在深度卷积神经网络（Deep CNNs）的推动下取得了显著进展。现有大多数方法主要依赖RGB图像信息来区分显著物体，但在复杂场景下仍面临挑战。为解决这一问题，近年来涌现出大量基于RGBD（即RGB与深度图联合输入）的网络架构，通过将深度图作为独立输入，并与RGB信息进行特征融合，以提升检测性能。受RGB与RGBD方法各自优势的启发，本文提出一种新颖的深度感知显著性物体检测框架，具有以下三项创新设计：1）训练阶段仅使用深度信息，而推理阶段仅依赖RGB图像输入，实现高效轻量化的部署；2）通过多层次的深度感知正则化机制，全面优化显著性特征的表达能力；3）利用深度信息作为误差加权图，动态修正分割过程中的预测结果。结合上述设计，本工作首次实现了仅以RGB图像为推理输入的统一深度感知框架。该方法不仅在五个公开的RGB-SOD基准数据集上超越了当前最先进（SOTA）的性能，且在五个基准上大幅领先于传统的RGBD方法，同时仅依赖较少的信息输入并具备轻量化的实现结构。相关代码与模型将公开发布，以促进学术交流与应用发展。

源 PDF