3 个月前

基于Transformer的多粒度特征用于无监督行人重识别

基于Transformer的多粒度特征用于无监督行人重识别

摘要

从卷积神经网络(CNN)中提取的多粒度特征在有监督的人体再识别(Re-ID)任务中已展现出强大的判别能力。受此启发,本文研究了如何从纯Transformer架构中提取多粒度特征,以应对无监督Re-ID这一无标签但更具挑战性的任务。为此,我们基于改进的视觉Transformer(Vision Transformer, ViT)构建了一种双分支网络结构。在每个分支中,输出的局部token经过重塑后被均匀划分为多个条带,从而生成部件级特征;同时,两个分支的全局token取平均,生成全局特征。进一步地,基于当前表现优异的无监督Re-ID方法——离线-在线相机感知代理(Offline-Online Camera-Aware Proxies, O2CAP),我们针对全局特征与部件级特征分别定义了离线与在线对比学习损失,以实现有效的无监督学习。在三个主流人体Re-ID数据集上的大量实验表明,所提出的方法显著优于当前最先进的无监督Re-ID方法,大幅缩小了与有监督方法之间的性能差距。代码将于近期公开,地址为:https://github.com/RikoLi/WACV23-workshop-TMGF。

代码仓库

基准测试

基准方法指标
unsupervised-person-re-identification-on-12TMGF
Rank-1: 83.3
Rank-10: 92.1
Rank-5: 90.2
mAP: 58.2
unsupervised-person-re-identification-on-4TMGF
MAP: 89.5
Rank-1: 95.5
Rank-10: 98.7
Rank-5: 98.0
unsupervised-person-re-identification-on-5TMGF
MAP: 76.8
Rank-1: 86.7
Rank-10: 94.1
Rank-5: 92.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于Transformer的多粒度特征用于无监督行人重识别 | 论文 | HyperAI超神经