
摘要
大多数显著目标检测方法使用U-Net或特征金字塔网络(FPN)作为其基本结构。这些方法在编码器与解码器交换信息时忽略了两个关键问题:一是两者之间的干扰控制不足,二是没有考虑不同编码器块的贡献差异。在这项工作中,我们提出了一种简单的门控网络(GateNet),以同时解决这两个问题。借助多级门控单元,编码器中的有价值上下文信息可以最优地传递给解码器。我们设计了一种新颖的门控双分支结构,以促进不同特征层次之间的协作,并提高整个网络的区分能力。通过双分支设计,可以进一步恢复显著图的更多细节。此外,我们采用了基于提出的“折叠”操作(Fold-ASPP)的空洞空间金字塔池化,以精确地定位各种尺度的显著对象。广泛的实验表明,在五个具有挑战性的数据集上,所提出的模型在不同的评估指标下优于大多数现有最先进方法。
代码仓库
xiaoqi-zhao-dlut/msnet
pytorch
GitHub 中提及
xiaoqi-zhao-dlut/multi-source-aps-zvos
pytorch
GitHub 中提及
Xiaoqi-Zhao-DLUT/GateNet-RGB-Saliency
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| dichotomous-image-segmentation-on-dis-te1 | GateNet | E-measure: 0.766 HCE: 230 MAE: 0.099 S-Measure: 0.701 max F-Measure: 0.620 weighted F-measure: 0.517 |
| dichotomous-image-segmentation-on-dis-te2 | GateNet | E-measure: 0.804 HCE: 501 MAE: 0.102 S-Measure: 0.737 max F-Measure: 0.702 weighted F-measure: 0.598 |
| dichotomous-image-segmentation-on-dis-te3 | GateNet | E-measure: 0.815 HCE: 972 MAE: 0.103 S-Measure: 0.747 max F-Measure: 0.726 weighted F-measure: 0.620 |
| dichotomous-image-segmentation-on-dis-te4 | GateNet | E-measure: 0.803 HCE: 3654 MAE: 0.109 S-Measure: 0.743 max F-Measure: 0.729 weighted F-measure: 0.625 |
| dichotomous-image-segmentation-on-dis-vd | GateNet | E-measure: 0.783 HCE: 1493 MAE: 0.110 S-Measure: 0.723 max F-Measure: 0.678 weighted F-measure: 0.574 |