3 个月前

TransReID:基于Transformer的物体重识别

TransReID:基于Transformer的物体重识别

摘要

在行人与物体重识别(ReID)任务中,提取鲁棒的特征表示是核心挑战之一。尽管基于卷积神经网络(CNN)的方法已取得显著进展,但其每次仅处理局部邻域信息,且受卷积与下采样操作(如池化和步幅卷积)的影响,容易导致细节信息的丢失。为克服上述局限,本文提出一种纯Transformer架构的物体ReID框架——TransReID。具体而言,我们首先将图像划分为若干图像块(patches),并构建一个基于Transformer的强基准模型,通过若干关键改进,在多个主流ReID基准上取得了与CNN方法相当甚至更优的性能。为进一步提升Transformer在ReID任务中对复杂场景的鲁棒特征学习能力,本文精心设计了两个新型模块:(i)拼图块模块(Jigsaw Patch Module, JPM),通过移位(shift)与图像块打乱(patch shuffle)操作重新排列图像块嵌入,生成具有更强判别能力与更广泛覆盖范围的鲁棒特征;(ii)侧信息嵌入模块(Side Information Embeddings, SIE),通过引入可学习的嵌入向量,融合相机视角等非视觉线索,有效缓解因相机或视角变化带来的特征偏差问题。据我们所知,这是首个将纯Transformer架构系统应用于ReID任务的研究工作。实验结果表明,TransReID在行人与车辆ReID多个基准数据集上均取得了领先性能,显著超越现有方法,展现出卓越的泛化能力与先进性。

代码仓库

darrishabh/coviprox
pytorch
GitHub 中提及
heshuting555/TransReID
官方
pytorch
GitHub 中提及
ChristmasStory/TransReID-main
pytorch
GitHub 中提及
damo-cv/transreid
pytorch
GitHub 中提及

基准测试

基准方法指标
person-re-identification-on-dukemtmc-reidTransReID (w/o RK)
Rank-1: 91.1
mAP: 82.1
person-re-identification-on-market-1501TransReID (w/o RK)
Rank-1: 95.2
mAP: 89.5
person-re-identification-on-market-1501-cTransReID
Rank-1: 53.19
mAP: 27.38
mINP: 1.98
person-re-identification-on-msmt17TransReID
Rank-1: 86.20
mAP: 69.40
vehicle-re-identification-on-veri-776TransReID
Rank-1: 97.1
mAP: 82.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TransReID:基于Transformer的物体重识别 | 论文 | HyperAI超神经