3 个月前

基于树结构与参考关节的3D动作识别骨架图像表示

基于树结构与参考关节的3D动作识别骨架图像表示

摘要

近年来,计算机视觉研究领域致力于探索如何建模视频中的时序动态,以实现三维人体动作识别。为此,研究主要围绕两种基准方法展开:(i)采用长短期记忆(LSTM)的循环神经网络(RNN);以及(ii)将骨骼图像表示作为输入馈入卷积神经网络(CNN)的方法。尽管RNN类方法取得了优异的识别性能,但其在高效学习骨骼关节点之间空间关系方面存在局限。相比之下,用于输入CNN的骨骼图像表示具有天然优势,能够从二维数组中学习结构化信息(即自动捕捉骨骼关节点之间的空间关系)。为进一步提升此类表示的表达能力,本文提出一种新型骨骼图像表示方法——树结构参考关节点图像(Tree Structure Reference Joints Image, TSRJI),可作为CNN的输入。该方法的优势在于融合了参考关节点与树状骨架结构:前者通过引入多样化的关节点空间关系增强表征,后者则通过深度优先遍历算法保留关键的空间拓扑结构。实验结果表明,所提出的TSRJI表示在两个公开数据集上均表现出显著的有效性,在最新的NTU RGB+D 120数据集上取得了当前最优的识别性能。

代码仓库

carloscaetano/skeleton-images
官方
GitHub 中提及

基准测试

基准方法指标
action-recognition-in-videos-on-ntu-rgbd-120TSRJI
Accuracy (Cross-Setup): 67.9
Accuracy (Cross-Subject): 62.8
skeleton-based-action-recognition-on-ntu-rgbdTSRJI (Late Fusion) + HCN
Accuracy (CS): 73.3
Accuracy (CV): 80.3
skeleton-based-action-recognition-on-ntu-rgbd-1TSRJI (Late Fusion) + HCN
Accuracy (Cross-Setup): 62.8%
Accuracy (Cross-Subject): 67.9%
skeleton-based-action-recognition-on-ntu-rgbd-1TSRJI (Late Fusion)
Accuracy (Cross-Setup): 59.7%
Accuracy (Cross-Subject): 65.5%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于树结构与参考关节的3D动作识别骨架图像表示 | 论文 | HyperAI超神经