
摘要
行人重识别(Person Re-Identification)旨在从由多个摄像头或同一摄像头在不同时间与位置拍摄的图像中检索出特定行人的身份信息。由于该技术在监控、人机交互等多种视觉应用中具有重要意义,相关方法必须具备高可靠性与高效性。尽管近年来不断有更复杂的深度网络架构被提出以提升性能,但这些方法也带来了模型整体复杂度的显著增加。本文提出一种轻量级网络结构,采用统一的多分支架构,融合全局特征、局部部件特征与通道特征,并基于资源高效的OSNet主干网络构建。通过合理结合多种训练策略与设计选择,所提出的模型在CUHK03标注集、CUHK03检测集以及Market-1501数据集上均取得了当前最优性能,分别达到85.1% mAP / 87.2% Rank-1、82.4% mAP / 84.9% Rank-1和91.5% mAP / 96.3% Rank-1的准确率。
代码仓库
mikel-brostrom/boxmot
pytorch
GitHub 中提及
jixunbo/LightMBN
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| person-re-identification-on-cuhk03-detected | LightMBN (w/o ReRank) | MAP: 82.4 Rank-1: 84.9 |
| person-re-identification-on-cuhk03-labeled | LightMBN (w/o ReRank) | MAP: 85.1 Rank-1: 87.2 |
| person-re-identification-on-market-1501 | LightMBN | mINP: 0.50 |
| person-re-identification-on-market-1501 | LightMBN (RR) | Rank-1: 96.8 mAP: 95.3 |
| person-re-identification-on-market-1501 | LightMBN (w/o ReRank) | Rank-1: 96.3 mAP: 91.5 |