4 个月前

多尺度上下文感知网络与Transformer在步态识别中的应用

多尺度上下文感知网络与Transformer在步态识别中的应用

摘要

尽管步态识别近年来受到了越来越多的研究关注,由于空间域中的轮廓差异非常细微,时间特征表示对于步态识别至关重要。受人类能够通过自适应聚焦不同时间尺度的片段来区分不同个体步态这一现象的启发,我们提出了一种用于步态识别的多尺度上下文感知网络(MCAT)。MCAT 在三个时间尺度上生成时间特征,并利用局部和全局视角的上下文信息自适应地聚合这些特征。具体而言,MCAT 包含一个自适应时间聚合(ATA)模块,该模块首先进行局部关系建模,然后进行全局关系建模,以融合多尺度特征。此外,为了弥补因时间操作导致的空间特征损坏,MCAT 引入了一个显著空间特征学习(SSFL)模块,用于选择具有判别性的空间特征组。在三个数据集上进行的大量实验表明了该方法的最先进性能。具体来说,在 CASIA-B 数据集上,我们在正常行走、携带包和穿着外套条件下分别达到了 98.7%、96.2% 和 88.7% 的首位准确率;在 OU-MVLP 数据集上达到了 97.5% 的首位准确率;在 GREW 数据集上达到了 50.6% 的首位准确率。源代码将在 https://github.com/zhuduowang/MCAT.git 提供。

基准测试

基准方法指标
gait-recognition-on-oumvlpCSTL
Averaged rank-1 acc(%): 91.0
multiview-gait-recognition-on-casia-bCSTL
Accuracy (Cross-View, Avg): 94.5
BG#1-2: 94.8
CL#1-2: 88.7
NM#5-6 : 98.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多尺度上下文感知网络与Transformer在步态识别中的应用 | 论文 | HyperAI超神经