3 个月前

S2SD:用于深度度量学习的同步相似性自蒸馏

S2SD:用于深度度量学习的同步相似性自蒸馏

摘要

深度度量学习(Deep Metric Learning, DML)通过学习具有泛化能力的嵌入空间,为视觉相似性计算和零样本学习等任务提供了关键工具。尽管近年来DML在不同训练目标上已表现出性能饱和,但已有研究表明,模型的泛化能力随嵌入空间维度的提升而增强。然而,高维嵌入也带来了下游应用中更高的检索开销。为解决这一矛盾,我们提出了一种基于相似性的联合自蒸馏方法(Simultaneous Similarity-based Self-distillation, S2SD)。S2SD通过从辅助的高维嵌入空间与特征空间中引入知识蒸馏,在训练过程中利用互补上下文信息,从而提升模型性能,同时在推理阶段保持原有的计算成本,且对训练时间几乎不产生额外开销。在多种训练目标与标准基准上的实验与消融分析表明,S2SD在Recall@1指标上实现了最高达7%的显著提升,并刷新了当前最优性能记录。代码已开源,地址为:https://github.com/MLforHealth/S2SD。

代码仓库

MLforHealth/S2SD
官方
pytorch

基准测试

基准方法指标
metric-learning-on-cars196ResNet50 + S2SD
R@1: 89.5
metric-learning-on-cub-200-2011ResNet50 + S2SD
R@1: 70.1
metric-learning-on-stanford-online-products-1ResNet50 + S2SD
R@1: 81.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
S2SD:用于深度度量学习的同步相似性自蒸馏 | 论文 | HyperAI超神经