3 个月前

面向行人重识别的模板感知Transformer

面向行人重识别的模板感知Transformer

摘要

行人重识别(Person Re-Identification, ReID)是一项具有挑战性的计算机视觉任务,旨在在无法获取人脸信息的情况下识别或验证一个或多个行人。在ReID任务中,难以区分的背景通常会干扰模型对前景的感知,从而降低识别性能。一般而言,同一摄像头拍摄的背景具有较高的相似性,而不同摄像头之间的背景则存在显著差异。基于这一观察,本文提出了一种模板感知的Transformer方法(Template-aware Transformer, TAT),通过在Transformer结构中引入可学习的模板,使模型能够学习样本间的不可区分特征,并减少对低区分度区域(如背景和遮挡区域)的关注。在编码器的多头注意力模块中,该模板引导模型关注图像中不可区分的特征,并随着编码器块的加深,逐步增强对可区分特征的注意力。此外,考虑到ReID任务的特性,我们利用辅助信息增加模板的数量,以提升模型对不同摄像头ID下显著变化背景的适应能力。实验结果表明,所提出的理论在多个公开数据集上均具有有效性,并通过定量评估取得了具有竞争力的性能表现。

基准测试

基准方法指标
person-re-identification-on-dukemtmc-reidTAT
Rank-1: 91.5
mAP: 82.5
person-re-identification-on-market-1501TAT
Rank-1: 95.8
mAP: 89.7
person-re-identification-on-occluded-dukemtmcTAT
Rank-1: 68.2
mAP: 60.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向行人重识别的模板感知Transformer | 论文 | HyperAI超神经