3 个月前

基于视频的人体再识别的多粒度超图学习

基于视频的人体再识别的多粒度超图学习

摘要

基于视频的人体重识别(video-based person re-identification, re-ID)是计算机视觉领域的重要研究课题。解决这一具有挑战性任务的关键在于有效利用视频序列中的时空线索。本文提出一种新颖的图结构框架——多粒度超图(Multi-Granular Hypergraph, MGH),通过在多个粒度层次上建模时空依赖关系,以提升特征表示能力。具体而言,该框架利用视频序列中不同层级的基于部件的特征,构建具有不同空间粒度的超图;在每个超图中,通过连接跨不同时间范围的图节点(即基于部件的特征)的超边,捕捉不同的时间粒度。所提出的超图传播机制与特征聚合策略,能够显式地处理重识别任务中两个关键问题:特征错位(misalignment)与遮挡(occlusion)。此外,为进一步增强整体视频表征能力,我们基于互信息最小化原则,学习多种粒度下的多样化图级表示。在三个广泛使用的基准数据集上进行的大量实验充分验证了所提框架的有效性。值得注意的是,仅使用MGH框架即在MARS数据集上实现了90.0%的Top-1准确率,显著优于现有最先进方法。相关代码已开源,地址为:https://github.com/daodaofr/hypergraph_reid。

代码仓库

基准测试

基准方法指标
person-re-identification-on-ilids-vidMGH
Rank-1: 85.6
Rank-10: 99.5
Rank-5: 97.1
person-re-identification-on-marsmgh
Rank-1: 90.0
Rank-20: 98.5
Rank-5: 96.7
mAP: 85.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于视频的人体再识别的多粒度超图学习 | 论文 | HyperAI超神经