3 个月前

基于行人重识别模型的时尚检索强基准

基于行人重识别模型的时尚检索强基准

摘要

时尚检索是一项具有挑战性的任务,旨在从图像中精确匹配相应的时尚单品。该任务的难点主要源于服装品类的细粒度特性,以及类内与类间存在极大的差异性。此外,该任务中的查询图像(query)与源图像(source)通常来自不同领域——前者多为街拍照片,后者则多为商品目录图像。由于两者在图像质量、光照条件、对比度、背景复杂度以及商品展示方式等方面存在显著差异,导致跨域差异显著。因此,时尚检索已成为学术界与工业界共同关注的活跃研究领域。受近期行人重识别(Person Re-Identification, ReID)研究进展的启发,我们借鉴并适配了当前领先的ReID模型,将其应用于时尚检索任务。本文提出了一种简洁的基线模型,在架构远为简单的情况下,显著超越了此前的最先进方法。我们在Street2Shop与DeepFashion两个主流数据集上进行了深入的实验,充分验证了所提方法的有效性。最后,我们提出了一种跨域(跨数据集)评估方法,用于检验时尚检索模型在不同数据分布下的鲁棒性。

代码仓库

基准测试

基准方法指标
image-retrieval-on-deepfashion-consumer-toRST Model (ResNet50-IBN-A, 320x320)
Rank-1: 37.8
Rank-10: 71.1
Rank-20: 77.2
Rank-50: 84.1
mAP: 43.0
image-retrieval-on-exact-street2shopRST Model (ResNet50-IBN-A, 320x320)
Rank-1: 53.7
Rank-10: 69.8
Rank-20: 73.6
mAP: 46.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于行人重识别模型的时尚检索强基准 | 论文 | HyperAI超神经