
摘要
行人重识别(person re-identification,简称person re-ID)通常被视为一个图像检索问题。该任务旨在从大规模图像库中检索出与查询行人匹配的图像。在实际应用中,行人重识别通常采用自动检测器获取裁剪后的行人图像。然而,这一过程会引入两类检测器误差:背景信息过多以及人体部分缺失。这两类误差均会降低行人图像对齐的质量,并由于位置与尺度的差异,影响行人匹配的准确性。为解决上述对齐问题,本文提出可通过识别过程本身来学习对齐信息。为此,我们引入了行人对齐网络(Pedestrian Alignment Network, PAN),该网络能够在无需额外标注信息的前提下,实现判别性特征嵌入学习与行人图像的自适应对齐。我们的关键观察是:当卷积神经网络(CNN)学习区分不同身份时,其生成的特征图通常在人体区域表现出强烈的激活,而背景区域的激活则较弱。基于这一注意力机制,所提出的网络能够自适应地在边界框内定位并对齐行人图像。可视化结果表明,使用PAN后,行人的对齐效果显著提升。在三个大规模重识别数据集上的实验结果表明,PAN有效增强了特征嵌入的判别能力,并在性能上达到与当前最先进方法相当的水平。
代码仓库
layumi/Pedestrian_Alignment
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| person-re-identification-on-cuhk03-detected-1 | PAN+re-rank | MAP: 43.8 Rank-1: 41.9 |
| person-re-identification-on-cuhk03-detected-1 | PAN(Zheng et al., [2017a]) | MAP: 34 Rank-1: 36.3 |
| person-re-identification-on-cuhk03-labeled | PAN+re-rank | MAP: 45.8 Rank-1: 43.9 |
| person-re-identification-on-cuhk03-labeled | PAN(Zheng et al., [2017a]) | MAP: 35.0 Rank-1: 36.9 |
| person-re-identification-on-dukemtmc-reid | PAN | Rank-1: 71.59 mAP: 51.51 |
| person-re-identification-on-dukemtmc-reid | PAN + re-rank | Rank-1: 75.94 mAP: 66.74 |
| person-re-identification-on-market-1501 | PAN (GAN)+re-rank | Rank-1: 88.57 mAP: 81.53 |