3 个月前

PADS:面向视觉相似性学习的策略自适应采样

PADS:面向视觉相似性学习的策略自适应采样

摘要

学习视觉相似性通常需要建模图像三元组之间的关系。尽管三元组方法具有强大的表达能力,但其计算复杂度较高,通常只能在所有可能的训练三元组中选取子集进行训练。因此,在学习过程中决定何时使用哪些训练样本的采样策略至关重要。目前主流的采样方法为固定采样或课程学习(curriculum)采样策略,这些策略在训练开始前即被预先设定。然而,该问题本质上更需要一种能够根据训练过程中相似性表示的实际状态动态调整的采样机制。为此,我们引入强化学习,设计一个教师网络,根据学习网络(即视觉相似性表示)的当前状态动态调整采样分布。在标准三元组损失函数基础上,基于基准数据集的实验表明,我们的自适应采样策略显著优于固定采样策略。此外,尽管我们的方法仅在基础三元组学习框架之上应用自适应采样,仍能取得与当前最先进方法相媲美的性能,而后者通常依赖于多样化的额外学习信号或复杂的集成架构。相关代码可于 https://github.com/Confusezius/CVPR2020_PADS 获取。

代码仓库

Confusezius/CVPR2020_PADS
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
metric-learning-on-cars196ResNet50 (128) + PADS
R@1: 83.5
metric-learning-on-cub-200-2011ResNet50 (128) + PADS
R@1: 67.3
metric-learning-on-stanford-online-products-1ResNet50 (128) + PADS
R@1: 76.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PADS:面向视觉相似性学习的策略自适应采样 | 论文 | HyperAI超神经