摘要
提出了一种受早期灵长类视觉系统行为特征与神经架构启发的视觉注意系统。该系统将多尺度图像特征融合为单一的拓扑显著性图谱,随后通过一个动态神经网络,按照显著性由高到低的顺序选择关注区域。该系统通过以计算高效的方式快速筛选出显著性突出的位置,从而将复杂的场景理解问题分解为对关键区域的逐个精细分析。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-saliency-detection-on-msu-video | ITTI | AUC-J: 0.811 CC: 0.572 FPS: 2.23 KLDiv: 0.799 NSS: 1.34 SIM: 0.544 |