3 个月前

基于噪声标签的大规模预训练用于行人重识别

基于噪声标签的大规模预训练用于行人重识别

摘要

本文旨在解决行人重识别(Person Re-Identification, Re-ID)中存在噪声标签的预训练问题。为构建预训练任务,我们在现有未标注Re-ID数据集“LUPerson”的原始视频上应用了一个简单的在线多目标跟踪系统,由此生成带有噪声标签的变体数据集,命名为“LUPerson-NL”。由于这些ID标签由轨迹片段(tracklets)自动推导而来,不可避免地包含噪声。为此,我们提出了一种基于噪声标签的大规模预训练框架——PNL(Pre-training with Noisy Labels),该框架包含三个学习模块:监督式Re-ID学习、基于原型的对比学习,以及标签引导的对比学习。原则上,这三个模块的联合学习不仅能够将相似样本聚类至同一原型,还能基于原型分配结果对噪声标签进行修正。我们证明,直接从原始视频中进行学习是一种极具潜力的预训练替代方案,其利用空间与时间相关性作为弱监督信号。这一简洁的预训练任务为在“LUPerson-NL”数据集上从零开始学习当前最优(SOTA)Re-ID表征提供了可扩展的途径,无需依赖复杂的技巧。例如,在采用相同的监督式Re-ID方法MGN时,我们的预训练模型在CUHK03、DukeMTMC和MSMT17三个数据集上,分别相较无监督预训练方法提升了5.7%、2.2%和2.3%的mAP。在小样本或少样本设置下,性能提升更为显著,表明所学习表征具有更强的可迁移性。代码已开源,地址为:https://github.com/DengpanFu/LUPerson-NL

代码仓库

dengpanfu/luperson-nl
官方
pytorch
GitHub 中提及
DengpanFu/LUPerson
pytorch
GitHub 中提及

基准测试

基准方法指标
person-re-identification-on-cuhk03Weakly Supervised Pre-training (ResNet50+BDB)
MAP: 82.3
Rank-1: 84.7
person-re-identification-on-dukemtmc-reidWeakly Supervised Pre-training (ResNet50+MGN)
Rank-1: 92.0
mAP: 84.3
person-re-identification-on-market-1501Weakly Supervised Pre-training (ResNet50+MGN)
Rank-1: 96.6
mAP: 91.9
person-re-identification-on-msmt17Weakly Supervised Pre-training (ResNet50+MGN)
Rank-1: 86.0
mAP: 68.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于噪声标签的大规模预训练用于行人重识别 | 论文 | HyperAI超神经