3 个月前

用于图像检索的鲁棒且可分解的平均精度

用于图像检索的鲁棒且可分解的平均精度

摘要

在图像检索任务中,标准的评估指标依赖于得分排序,例如平均精度(Average Precision, AP)。本文提出了一种鲁棒且可分解的平均精度(Robust and Decomposable Average Precision, ROADMAP)方法,旨在解决在端到端训练深度神经网络时使用AP所面临的两大挑战:不可微性与不可分解性。首先,我们提出了一种新的、可微的排名函数近似方法,该方法能够为AP损失提供上界,从而确保训练过程的稳定性与鲁棒性。其次,我们设计了一种简洁而有效的损失函数,有效缩小了整个训练集上的AP与批次平均近似值之间的可分解性差距,并为此提供了理论保障。在三个图像检索数据集上进行的大量实验表明,ROADMAP优于多种近期提出的AP近似方法,充分验证了本文两项核心贡献的重要性。最终,利用ROADMAP训练深度模型可获得优异性能,在三个数据集上均超越了现有最先进方法的水平。

代码仓库

elias-ramzi/roadmap
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-retrieval-on-cub-200-2011ROADMAP (ResNet-50)
R@1: 68.5
image-retrieval-on-cub-200-2011ROADMAP (Deit-B)
R@1: 77.4
image-retrieval-on-inaturalistROADMAP (DeiT-S)
R@1: 73.6
R@16: 93.1
R@32: 95.2
R@5: 86.2
image-retrieval-on-inaturalistROADMAP (ResNet-50)
R@1: 69.1
R@16: 91.3
R@32: 93.9
R@5: 83.1
image-retrieval-on-sopROADMAP (DeiT-B)
R@1: 86.0
image-retrieval-on-sopROADMAP (ResNet-50)
R@1: 83.1
metric-learning-on-stanford-online-products-1ROADMAP (ResNet-50)
R@1: 83.1
metric-learning-on-stanford-online-products-1ROADMAP (DeiT-S)
R@1: 86.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于图像检索的鲁棒且可分解的平均精度 | 论文 | HyperAI超神经