
摘要
深度嵌入回答了一个简单的问题:两张图像之间的相似度有多高?学习这些嵌入是验证、零样本学习和视觉搜索的基础。目前最突出的方法是通过适当的损失函数(如对比损失或三元组损失)优化深度卷积网络。尽管大量研究仅专注于损失函数,本文表明选择训练样本同样重要。我们提出了距离加权采样方法,该方法能够选择比传统方法更具信息量和稳定性的样本。此外,我们还证明了一种简单的基于边距的损失函数足以超越所有其他损失函数。我们在Stanford Online Products、CAR196和CUB200-2011数据集上评估了我们的方法,用于图像检索和聚类任务,并在LFW数据集上进行了人脸验证测试。我们的方法在这所有任务中均达到了最先进的性能。
代码仓库
ArturPrzybysz/MNIST-siamese
tf
GitHub 中提及
minzwon/tag-based-music-retrieval
pytorch
GitHub 中提及
immuno121/audio_source_classification
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-retrieval-on-cars196 | Margin | R@1: 86.9 |
| metric-learning-on-cars196 | ResNet-50 + Margin | R@1: 79.6 |
| metric-learning-on-cub-200-2011 | ResNet-50 + Margin | R@1: 63.6 |