
摘要
当前最先进的骨骼动作识别模型在细粒度关节(如面部关节、手指关节)方面的缺失,已成为制约其性能提升的根本瓶颈。尽管存在这一瓶颈,学术界的研究努力仍主要集中于提出新型网络架构,而忽视了对细粒度关节信息的有效利用。为针对性地解决这一问题,我们提出了两个基于姿态的人体动作数据集——NTU60-X 和 NTU120-X。这两个数据集在现有最大规模的动作识别数据集 NTU-RGBD 的基础上进行了扩展,不仅保留了原始数据集中每个骨架的25个身体关节,还新增了手指与面部关节信息,从而实现了更为丰富的骨骼表征。我们对当前最先进的方法进行了适当调整,以支持在所提出数据集上的训练。实验结果表明,NTU-X 系列数据集在有效缓解上述瓶颈方面具有显著成效,不仅整体性能得到提升,而且在以往表现最差的动作类别上也实现了显著改进。相关代码与预训练模型已开源,详见:https://github.com/skelemoa/ntu-x。
代码仓库
skelemoa/ntu-x
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| skeleton-based-action-recognition-on-ntu60-x | 4s-ShiftGCN | Accuracy (Body + Fingers + Face joints): 89.64 Accuracy (Body + Fingers joints): 91.78 Accuracy (Body joints): 89.56 |
| skeleton-based-action-recognition-on-ntu60-x | MS-G3D | Accuracy (Body + Fingers + Face joints): 91.12 Accuracy (Body + Fingers joints): 91.76 Accuracy (Body joints): 91.26 |
| skeleton-based-action-recognition-on-ntu60-x | PA-ResGCN | Accuracy (Body + Fingers + Face joints): 89.79 Accuracy (Body + Fingers joints): 91.64 Accuracy (Body joints): 89.98 |