3 个月前

DiVA:用于深度度量学习的多样化视觉特征聚合

DiVA:用于深度度量学习的多样化视觉特征聚合

摘要

视觉相似性在众多计算机视觉应用中扮演着关键角色。深度度量学习(Deep Metric Learning, DML)是一种强大的框架,用于学习此类相似性,不仅能够从训练数据泛化到分布相同的测试数据,尤其能够推广至未知的测试类别。然而,当前主流的DML学习范式为类别判别式的监督训练,通常导致学习到的特征表示仅专注于区分训练阶段的已知类别。为了实现有效的泛化,图像表示需能够捕捉多样化的数据特征。为此,本文提出并研究了多个互补的学习任务,这些任务仅依赖标准DML设置中的可用训练样本与标签,但旨在建模概念上不同的数据关系。通过同时优化这些任务,我们训练一个单一模型以聚合各类任务的训练信号,从而在多个公认的DML基准数据集上实现了卓越的泛化能力与当前最优的性能表现。

代码仓库

wzzheng/DCML
pytorch
GitHub 中提及
Confusezius/ECCV2020_DiVA_MultiFeature_DML
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
metric-learning-on-cars196ResNet50 + DiVA
R@1: 87.6
metric-learning-on-cub-200-2011ResNet50 + DiVA
R@1: 69.2
metric-learning-on-stanford-online-products-1ResNet50 + DiVA
R@1: 79.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DiVA:用于深度度量学习的多样化视觉特征聚合 | 论文 | HyperAI超神经