
摘要
最近的研究表明,显式的深度特征匹配以及大规模多样化的训练数据可以显著提高行人重识别的泛化能力。然而,大规模数据上学习深度匹配器的效率尚未得到充分研究。尽管使用分类参数或类别记忆进行学习是一种流行的方法,但这种方法会产生较大的内存和计算成本。相比之下,在小批量内进行成对的深度度量学习可能是一个更好的选择。然而,最常用的随机采样方法——著名的PK采样器(PK sampler)对于深度度量学习来说并不具有信息性和高效性。虽然在线难例挖掘在一定程度上提高了学习效率,但在随机采样后的迷你批次中进行挖掘仍然存在局限性。这启发我们探索在数据采样阶段更早地使用难例挖掘。为此,本文提出了一种高效的迷你批次采样方法,称为图采样(Graph Sampling, GS),用于大规模深度度量学习。基本思想是在每个训练周期开始时为所有类别构建一个最近邻关系图。然后,每个迷你批次由随机选择的一个类别及其最近邻类别组成,以提供对学习有帮助且具有挑战性的样本。结合改进的竞争基线模型,我们在可泛化的行人重识别方面取得了显著进步,在MSMT17数据集上使用RandPerson训练时,Rank-1准确率提高了25.1%。此外,在CUHK03-NP数据集上使用MSMT17训练时,所提出的方法在Rank-1准确率上也优于竞争基线模型,提升了6.8%。同时,当在包含8,000个身份的RandPerson数据集上训练时,训练时间从25.4小时显著减少到2小时。代码可在以下地址获取:https://github.com/ShengcaiLiao/QAConv。
代码仓库
shengcailiao/QAConv
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| generalizable-person-re-identification-on-20 | QAConv-GS | ClonedPerson-u003eRank-1: 49.1 ClonedPerson-u003emAP: 18.5 Market-1501-u003eRank1: 45.9 Market-1501-u003emAP: 17.2 RandPerson-u003eRank-1: 45.1 RandPerson-u003emAP: 15.5 |
| generalizable-person-re-identification-on-21 | QAConv-GS | ClonedPerson-u003eRank-1: 84.5 ClonedPerson-u003emAP: 59.9 MSMT17-u003eRank-1: 79.1 MSMT17-u003emAP: 49.5 MSMT17-All-u003eRank-1: 82.4 MSMT17-All-u003emAP: 56.9 RandPerson-u003eRank-1: 76.7 RandPerson-u003emAP: 46.7 |
| generalizable-person-re-identification-on-22 | QAConv-GS | ClonedPerson-u003eRank-1: 22.6 ClonedPerson-u003emAP: 21.8 MSMT17-u003eRank-1: 20.9 MSMT17-u003emAP: 20.6 MSMT17-All-u003eRank-1: 27.6 MSMT17-All-u003emAP: 28.0 Market-1501-u003eRank-1: 19.1 Market-1501-u003emAP: 18.1 RandPerson-u003eRank-1: 18.4 RandPerson-u003emAP: 16.1 |
| generalizable-person-re-identification-on-23 | QAConv-GS | MSMT17-u003eRank1: 67.3 MSMT17-u003emAP: 49.4 MSMT17-All-u003eRank-1: 71.3 MSMT17-All-u003emAP: 53.5 |