
摘要
视觉相似性在众多计算机视觉应用中扮演着关键角色。深度度量学习(Deep Metric Learning, DML)是一种强大的框架,用于学习此类相似性,不仅能够从训练数据泛化到分布相同的测试数据,尤其能够推广至未知的测试类别。然而,当前主流的DML学习范式为类别判别式的监督训练,通常导致学习到的特征表示仅专注于区分训练阶段的已知类别。为了实现有效的泛化,图像表示需能够捕捉多样化的数据特征。为此,本文提出并研究了多个互补的学习任务,这些任务仅依赖标准DML设置中的可用训练样本与标签,但旨在建模概念上不同的数据关系。通过同时优化这些任务,我们训练一个单一模型以聚合各类任务的训练信号,从而在多个公认的DML基准数据集上实现了卓越的泛化能力与当前最优的性能表现。
代码仓库
wzzheng/DCML
pytorch
GitHub 中提及
Confusezius/ECCV2020_DiVA_MultiFeature_DML
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| metric-learning-on-cars196 | ResNet50 + DiVA | R@1: 87.6 |
| metric-learning-on-cub-200-2011 | ResNet50 + DiVA | R@1: 69.2 |
| metric-learning-on-stanford-online-products-1 | ResNet50 + DiVA | R@1: 79.6 |