4 个月前

多全局描述符组合用于图像检索

多全局描述符组合用于图像检索

摘要

近期在图像检索任务中的研究表明,组合不同模型和多个全局描述符可以提高性能。然而,为集成模型训练不同的子模型不仅难度大,而且在时间和内存方面效率低下。本文提出了一种新颖的框架,该框架利用多个全局描述符以获得集成效果,同时可以进行端到端训练。所提出的框架具有灵活性和可扩展性,可以通过全局描述符、CNN主干网络、损失函数和数据集进行调整。此外,我们通过定量和定性分析研究了组合多个全局描述符的有效性。大量实验表明,组合描述符优于单一全局描述符,因为它能够利用不同类型特征属性的优势。在基准评估中,所提出的框架在CARS196、CUB200-2011、In-shop Clothes和Stanford Online Products图像检索任务上达到了最先进的性能。我们的模型实现和预训练模型已公开发布。

代码仓库

clovaai/embedding-expansion
mxnet
GitHub 中提及
naver/cgd
官方
mxnet
GitHub 中提及
leftthomas/CGD
pytorch
GitHub 中提及
puneesh00/loop
mxnet
GitHub 中提及
flyingsheepbin/pet-biometrics
pytorch
GitHub 中提及

基准测试

基准方法指标
image-retrieval-on-cars196CGD (MG/SG)
R@1: 94.8
image-retrieval-on-cub-200-2011CGD (MG/SG)
R@1: 79.2
image-retrieval-on-in-shopCGD (SG/GS)
R@1: 91.9
image-retrieval-on-sopCGD (SG/GS)
R@1: 84.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多全局描述符组合用于图像检索 | 论文 | HyperAI超神经