8 个月前

计算机视觉

计算机视觉

Haodong Duan Yue Zhao Kai Chen Dahua Lin Bo Dai

摘要

近年来，人体骨架作为人体动作的紧凑表示形式，受到了越来越多的关注。许多基于骨架的动作识别方法采用了图卷积网络（GCN）来从人体骨架中提取特征。尽管先前的研究展示了积极的结果，但基于GCN的方法在鲁棒性、互操作性和可扩展性方面仍存在局限性。在这项工作中，我们提出了一种新的基于骨架的动作识别方法——PoseC3D，该方法依赖于3D热图堆栈而不是图序列作为人体骨架的基本表示形式。与基于GCN的方法相比，PoseC3D在学习时空特征方面更为有效，在对抗姿态估计噪声方面更具鲁棒性，并且在跨数据集设置中具有更好的泛化能力。此外，PoseC3D可以在不增加额外计算成本的情况下处理多人场景，并且其特征可以轻松地在早期融合阶段与其他模态进行整合，这为进一步提升性能提供了广阔的设计空间。在四个具有挑战性的数据集中，PoseC3D无论是在单独使用骨架时还是与RGB模态结合使用时，均表现出一致的优越性能。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Haodong Duan Yue Zhao Kai Chen Dahua Lin Bo Dai

摘要

近年来，人体骨架作为人体动作的紧凑表示形式，受到了越来越多的关注。许多基于骨架的动作识别方法采用了图卷积网络（GCN）来从人体骨架中提取特征。尽管先前的研究展示了积极的结果，但基于GCN的方法在鲁棒性、互操作性和可扩展性方面仍存在局限性。在这项工作中，我们提出了一种新的基于骨架的动作识别方法——PoseC3D，该方法依赖于3D热图堆栈而不是图序列作为人体骨架的基本表示形式。与基于GCN的方法相比，PoseC3D在学习时空特征方面更为有效，在对抗姿态估计噪声方面更具鲁棒性，并且在跨数据集设置中具有更好的泛化能力。此外，PoseC3D可以在不增加额外计算成本的情况下处理多人场景，并且其特征可以轻松地在早期融合阶段与其他模态进行整合，这为进一步提升性能提供了广阔的设计空间。在四个具有挑战性的数据集中，PoseC3D无论是在单独使用骨架时还是与RGB模态结合使用时，均表现出一致的优越性能。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

重新审视基于骨架的动作识别 | 论文 | HyperAI超神经