
摘要
深度度量学习旨在学习一个嵌入函数,该函数通常被建模为深度神经网络。这个嵌入函数通常将语义相似的图像在学习到的嵌入空间中放置得较近,而将语义不相似的图像放置得较远。最近,集成方法已被应用于深度度量学习,以获得最先进的结果。作为集成方法的一个重要方面,各个学习器的特征嵌入应具有多样性。为此,我们提出了一种基于注意力机制的集成方法,该方法使用多个注意力掩码(attention masks),从而使每个学习器可以关注对象的不同部分。我们还提出了一种散度损失(divergence loss),以鼓励学习器之间的多样性。所提出的方法被应用于深度度量学习的标准基准数据集上,实验结果表明,在图像检索任务中,该方法显著优于现有的最先进方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-retrieval-on-in-shop | ABE-8 | R@1: 87.3 |
| image-retrieval-on-sop | ABE-8 | R@1: 76.3 |
| metric-learning-on-cars196 | ABE-8-512 | R@1: 85.2 |
| metric-learning-on-cub-200-2011 | ABE-8-512 | R@1: 60.6 |