3 个月前

无监督预训练在行人重识别中的应用

无监督预训练在行人重识别中的应用

摘要

本文提出一个大规模无标注行人重识别(Re-ID)数据集“LUPerson”,并首次尝试通过无监督预训练来提升所学习行人Re-ID特征表示的泛化能力。这一工作旨在解决现有行人Re-ID数据集普遍规模有限的问题,其根源在于数据标注所需的人力成本极高。以往研究多借助在ImageNet上预训练的模型来缓解Re-ID数据不足的问题,但受限于ImageNet与行人Re-ID数据之间存在的显著域差异(domain gap),效果有限。LUPerson是一个包含超过20万身份、共计400万张图像的无标注数据集,其规模是现有最大Re-ID数据集的30倍,同时涵盖了更加多样的采集环境(如不同摄像头设置、场景类型等)。基于该数据集,我们从数据增强和对比损失(contrastive loss)两个角度,系统性地探究了学习高质量Re-ID特征的关键因素。在该大规模数据集上进行的无监督预训练,有效构建了一种通用性强的Re-ID特征表示,可显著提升各类现有行人Re-ID方法的性能。在多个基础模型框架中引入我们预训练的模型后,所提方法在四个广泛使用的Re-ID数据集(CUHK03、Market1501、DukeMTMC和MSMT17)上均取得了无需额外技巧(no bells and whistles)的当前最优结果。此外,实验结果表明,该方法在小规模目标数据集或少样本(few-shot)设置下的性能提升尤为显著。

代码仓库

DengpanFu/LUPerson
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
person-re-identification-on-cuhk03Unsupervised Pre-training (ResNet50+BDB)
MAP: 79.6
Rank-1: 81.9
person-re-identification-on-dukemtmc-reidUnsupervised Pre-training (ResNet101+RK)
Rank-1: 93.99
mAP: 92.77
person-re-identification-on-dukemtmc-reidUnsupervised Pre-training (ResNet101+MGN)
Rank-1: 91.9
mAP: 84.1
person-re-identification-on-market-1501Unsupervised Pre-training (ResNet101+MGN)
Rank-1: 97
mAP: 92
person-re-identification-on-market-1501Unsupervised Pre-training (ResNet101+RK)
mAP: 96.21
person-re-identification-on-market-1501-cLUPerson
Rank-1: 32.22
mAP: 10.37
mINP: 0.29
person-re-identification-on-msmt17Unsupervised Pre-training (ResNet101+MGN)
Rank-1: 86.6
mAP: 68.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
无监督预训练在行人重识别中的应用 | 论文 | HyperAI超神经