Command Palette
Search for a command to run...
DiVA:用于深度度量学习的多样化视觉特征聚合
DiVA:用于深度度量学习的多样化视觉特征聚合
Timo Milbich Karsten Roth Homanga Bharadhwaj Samarth Sinha Yoshua Bengio Björn Ommer Joseph Paul Cohen
摘要
视觉相似性在众多计算机视觉应用中扮演着关键角色。深度度量学习(Deep Metric Learning, DML)是一种强大的框架,用于学习此类相似性,不仅能够从训练数据泛化到分布相同的测试数据,尤其能够推广至未知的测试类别。然而,当前主流的DML学习范式为类别判别式的监督训练,通常导致学习到的特征表示仅专注于区分训练阶段的已知类别。为了实现有效的泛化,图像表示需能够捕捉多样化的数据特征。为此,本文提出并研究了多个互补的学习任务,这些任务仅依赖标准DML设置中的可用训练样本与标签,但旨在建模概念上不同的数据关系。通过同时优化这些任务,我们训练一个单一模型以聚合各类任务的训练信号,从而在多个公认的DML基准数据集上实现了卓越的泛化能力与当前最优的性能表现。