4 个月前

从原型投影的角度重新思考人员再识别问题

从原型投影的角度重新思考人员再识别问题

摘要

人员重识别(Re-ID)作为一项检索任务,在过去十年中取得了巨大的发展。现有的最先进方法通常遵循类似的框架,首先从输入图像中提取特征,然后通过分类器进行分类。然而,由于训练集和测试集之间没有身份重叠,分类器在推理阶段经常被丢弃,仅使用提取的特征通过距离度量来进行人员检索。本文重新思考了分类器在人员重识别中的作用,并提出了一种新的视角,即将分类器视为从图像特征到类别原型的投影。这些原型正是分类器学习到的参数。在这种视角下,我们将输入图像的身份描述为与所有原型的相似度,这些相似度随后被用作更具判别性的特征来执行人员重识别。因此,我们提出了一种新的基线模型ProNet,该模型创新性地保留了分类器在推理阶段的功能。为了促进类别原型的学习,对经过分类器投影的特征同时应用了三元组损失和身份分类损失。此外,我们还提出了改进版本ProNet++,进一步结合了多粒度设计。在四个基准数据集上的实验表明,我们提出的ProNet模型简单而有效,并显著优于以往的基线模型。ProNet++也在与基于变压器的竞争者相比中取得了具有竞争力甚至更好的结果。

基准测试

基准方法指标
person-re-identification-on-cuhk03ProNet++ (ResNet50+RK)
MAP: 91.9
Rank-1: 90.6
person-re-identification-on-cuhk03ProNet++
MAP: 82.7
Rank-1: 85.2
person-re-identification-on-market-1501ProNet++ (ResNet50+RK)
Rank-1: 96.4
mAP: 95.3
person-re-identification-on-market-1501ProNet++
Rank-1: 96
mAP: 90.2
person-re-identification-on-msmt17ProNet++
Rank-1: 85.4
mAP: 65.5
person-re-identification-on-msmt17ProNet++ (ResNet50+RK)
Rank-1: 88.2
mAP: 80
vehicle-re-identification-on-veri-776ProNet++ (ResNet50)
Rank-1: 97.7
mAP: 83.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从原型投影的角度重新思考人员再识别问题 | 论文 | HyperAI超神经