
摘要
深度度量学习旨在定义一种嵌入,使得语义相似的图像在嵌入空间中位于相近的位置,而语义不相似的图像则位于较远的位置。大量研究工作集中在损失函数和策略上,以尽可能将同一类别的图像在嵌入空间中拉近。本文提出了一种替代性的、宽松的嵌入策略,仅要求嵌入函数将每个训练图像映射到同一类别中最相似的样本,我们称这种方法为“简单正例”(Easy Positive)挖掘。我们通过一系列实验和可视化展示了这种简单正例挖掘能够生成更加灵活且对新未见数据泛化能力更强的嵌入。这一简单的挖掘策略在包括CUB、Stanford Online Products、In-Shop Clothes和Hotels-50K在内的图像检索数据集上的召回性能超过了现有的最先进方法(包括复杂的损失函数和集成方法)。
代码仓库
littleredxh/DREML
pytorch
GitHub 中提及
SilverIonn/EPHN-OpenSet
pytorch
GitHub 中提及
littleredxh/EasyPositiveHardNegative
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-retrieval-on-cars196 | EPSHN512 | R@1: 82.7 |
| image-retrieval-on-cub-200-2011 | EPSHN512 | R@1: 64.9 |
| image-retrieval-on-in-shop | EPSHN512 | R@1: 87.8 |
| image-retrieval-on-sop | EPSHN512 | R@1: 78.3 |
| metric-learning-on-cars196 | EPSHN(512) | R@1: 82.7 |
| metric-learning-on-cars196 | EPSHN(64) | R@1: 75.5 |
| metric-learning-on-cub-200-2011 | EPSHN(64) | R@1: 57.3 |
| metric-learning-on-cub-200-2011 | EPSHN(512) | R@1: 64.9 |
| metric-learning-on-in-shop-1 | EPSHN(512) | R@1: 87.8 |
| metric-learning-on-stanford-online-products-1 | EPSHN(512) | R@1: 78.3 |