3 个月前

姿态与关节感知的动作识别

姿态与关节感知的动作识别

摘要

近期动作识别领域的进展主要集中在RGB图像与光流特征上。本文提出一种基于关节(joint-based)的动作识别新方法。与其它模态不同,关节之间的空间构型及其运动能够生成简洁而有效的动作信息表示,从而为动作识别提供有力支持。为此,我们提出一种新型的关节驱动动作识别模型:该模型首先通过共享的运动编码器分别提取每个关节的运动特征,随后进行集体推理。模型中的关节选择模块对关节信息进行重新加权,以筛选出对任务最具判别性的关键关节。此外,我们设计了一种新颖的关节对比损失(joint-contrastive loss),该损失函数能够将表达相同动作的关节特征组拉近,增强特征的语义一致性。为进一步强化基于关节的表征能力,我们引入一种几何感知的数据增强策略,通过轻微扰动姿态热图(pose heatmaps)来保留动作的动力学特性。实验结果表明,我们的方法在JHMDB、HMDB、Charades以及AVA等主流动作识别数据集上,显著超越了当前最先进的基于关节的方法。当与基于RGB和光流的方法进行后期融合时,性能进一步提升。此外,该模型在Mimetics数据集(一个包含非上下文动作的挑战性数据集)上的表现也优于现有基准方法。

代码仓库

基准测试

基准方法指标
action-classification-on-charadesJMRN (Pose only)
MAP: 16.2
action-classification-on-charadesJMRN + R101-NL-LFB
MAP: 43.23
action-recognition-in-videos-on-ava-v21JMRN + SlowFast-R101-NL
mAP (Val): 28.4
action-recognition-in-videos-on-hmdb-51JRMN
Average accuracy of 3 splits: 54.2
action-recognition-in-videos-on-hmdb-51Ours + ResNext101 BERT
Average accuracy of 3 splits: 84.53
action-recognition-on-mimeticsSIP-Net
mAP: 38.3
action-recognition-on-mimeticsJMRN
mAP: 40
skeleton-based-action-recognition-on-jhmdb-2dJMRN (No GT pose)
Average accuracy of 3 splits: 68.55

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
姿态与关节感知的动作识别 | 论文 | HyperAI超神经