HyperAIHyperAI

Command Palette

Search for a command to run...

重新审视基于骨架的动作识别

Haodong Duan Yue Zhao Kai Chen Dahua Lin Bo Dai

摘要

近年来,人体骨架作为人体动作的紧凑表示形式,受到了越来越多的关注。许多基于骨架的动作识别方法采用了图卷积网络(GCN)来从人体骨架中提取特征。尽管先前的研究展示了积极的结果,但基于GCN的方法在鲁棒性、互操作性和可扩展性方面仍存在局限性。在这项工作中,我们提出了一种新的基于骨架的动作识别方法——PoseC3D,该方法依赖于3D热图堆栈而不是图序列作为人体骨架的基本表示形式。与基于GCN的方法相比,PoseC3D在学习时空特征方面更为有效,在对抗姿态估计噪声方面更具鲁棒性,并且在跨数据集设置中具有更好的泛化能力。此外,PoseC3D可以在不增加额外计算成本的情况下处理多人场景,并且其特征可以轻松地在早期融合阶段与其他模态进行整合,这为进一步提升性能提供了广阔的设计空间。在四个具有挑战性的数据集中,PoseC3D无论是在单独使用骨架时还是与RGB模态结合使用时,均表现出一致的优越性能。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供