
摘要
现有的行人重识别(re-id)方法在部署到新的未见过的场景时遇到困难,尽管在跨摄像头行人匹配方面取得了成功。近期的研究工作主要集中在域适应行人重识别上,通过利用新场景中的大量未标记数据进行半监督学习。然而,对于每个新场景,都需要首先收集足够的数据,然后训练一个域适应的re-id模型,这限制了这些方法的实际应用。相反,我们的目标是探索多个已标记的数据集,以学习适用于行人重识别的泛化域不变表示,期望这种方法对每个新出现的re-id场景都能普遍有效。为了在实际系统中追求实用性,我们收集了该领域的所有行人重识别数据集(共20个数据集),并选择了三个最常使用的数据集(即Market1501、DukeMTMC和MSMT17)作为未见过的目标域。此外,我们开发了DataHunter工具,从YouTube街景视频中收集了超过30万张弱标注图像(命名为YouTube-Human),这些图像与剩余的17个完全标注的数据集一起构成了多个源域。在这个名为FastHuman的大规模且具有挑战性的基准测试(约44万张标注图像)上,我们进一步提出了一种简单而有效的半监督知识蒸馏(SSKD)框架。SSKD通过为YouTube-Human分配软伪标签来有效利用弱标注数据,从而提高模型的泛化能力。在几种协议上的实验验证了所提出的SSKD框架在域泛化的行人重识别方面的有效性,其性能甚至可以与目标域上的监督学习相媲美。最后但同样重要的是,我们希望所提出的FastHuman基准测试能够推动域泛化行人重识别算法的下一步发展。
代码仓库
JDAI-CV/fast-reid
官方
pytorch
GitHub 中提及
xiaomingzhid/sskd
pytorch
GitHub 中提及
L1aoXingyu/reid_baseline
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| person-re-identification-on-market-1501 | SSKD(GH) | Rank-1: 97.36 mAP: 94.15 |