
摘要
在本研究中,我们提出了一种新型的深度引导多尺度循环注意力网络,用于显著性检测。该方法在复杂场景下表现出显著的性能优势。我们的网络在实验中验证了三大主要贡献,均展现出显著的实际应用价值。首先,我们设计了一种高效的深度精炼模块,通过残差连接充分提取并融合来自RGB流与深度流的多层次互补线索。其次,创新性地将富含空间信息的深度线索与多尺度上下文特征相结合,从而更精准地定位显著目标。第三,受人脑内部生成机制启发,我们引入了一种新颖的循环注意力模块,通过全面学习融合特征的内在语义关系,并借助面向记忆的场景理解机制,逐步优化局部细节,显著提升了模型性能。此外,我们构建了一个大规模的RGB-D数据集,涵盖更为复杂的场景,有助于对显著性检测模型进行更全面的评估。在六个公开数据集及自建数据集上的大量实验表明,所提方法能够准确识别显著目标,并在与16种先进RGB及RGB-D方法的对比中始终取得更优的性能表现。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| rgb-d-salient-object-detection-on-nju2k | DMRA | Average MAE: 0.051 S-Measure: 88.6 max E-Measure: 92.7 max F-Measure: 88.6 |