3 个月前

基于图像与部分分类标注的行人属性识别方法

基于图像与部分分类标注的行人属性识别方法

摘要

通过引入行人属性识别(Pedestrian Attribute Recognition, PAR)技术,可为行人重识别(re-ID)监控系统增添文本搜索功能。将基于卷积神经网络(CNN)的PAR模块集成到re-ID模型中,能够在两个任务上均实现高效性能,然而目前鲜有研究聚焦于通过改进数据而非模型结构来提升性能。大多数现代多任务学习方法在固定数据集上采用新型网络架构以超越先前方法,却往往忽视了计算成本、部署难度以及模型泛化能力等实际因素。为系统性评估数据对PAR性能的影响,本研究提出一个基于图像的、部分分类属性数据集(CA-Duke),该数据集基于DukeMTMC-reID数据集,包含36,411张图像,涵盖74种行人属性。然而,当前方法在确定新增模块的最佳接入位置时仍缺乏系统性策略,通常依赖实验试错方式在基准模型上选择分支插入位置以构建多任务网络。为此,本研究进一步提出一种两阶段学习方法,通过引入一种名为“分离指数”(Separation Index, SI)的新度量指标,评估潜在特征空间中数据的可分性,从而识别将PAR模块嵌入预训练re-ID网络的最佳位置。实验结果表明,在属性识别与检索任务上,全面且基于图像的标注方式可使F1指标提升3.31%。此外,结合SI度量与预训练网络,可在PAR任务上达到当前最优(state-of-the-art)性能。

基准测试

基准方法指标
pedestrian-attribute-recognition-on-dukemtmcMBNET
Accuracy: 91.13
person-re-identification-on-dukemtmc-reidMBNET
Rank-1: 94.39
Rank-5: 96.45
Rank-1: 94.39
Rank-10: 96.90
Rank-5: 96.45
mAP: 83.58
person-re-identification-on-market-1501MBNET
Rank-1: 94.77
mAP: 92.64

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于图像与部分分类标注的行人属性识别方法 | 论文 | HyperAI超神经