4 个月前

计算机视觉

计算机视觉

Liu Jun Shahroudy Amir Xu Dong Wang Gang

摘要

近年来，基于三维骨骼数据的人体动作识别（3D action recognition）因其简洁性、鲁棒性以及视角不变的表示能力而日益受到关注。针对该问题的最新研究提出采用基于循环神经网络（RNN）的学习方法，以建模时间域中的上下文依赖关系。本文将这一思想拓展至时空域，实现对输入数据在空间与时间两个维度上共同隐藏的动作相关信息源的联合分析。受人体骨骼图结构的启发，我们进一步提出一种基于树结构的更高效遍历方法。为应对三维骨骼数据中存在的噪声与遮挡问题，我们在LSTM中引入了一种新型门控机制，用以学习序列输入数据的可靠性，并据此动态调整其对存储于记忆单元中的长期上下文信息更新的影响。所提出的方法在四个具有挑战性的三维人体动作分析基准数据集上均取得了当前最优的性能表现。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

4 个月前

计算机视觉

计算机视觉

Liu Jun Shahroudy Amir Xu Dong Wang Gang

摘要

近年来，基于三维骨骼数据的人体动作识别（3D action recognition）因其简洁性、鲁棒性以及视角不变的表示能力而日益受到关注。针对该问题的最新研究提出采用基于循环神经网络（RNN）的学习方法，以建模时间域中的上下文依赖关系。本文将这一思想拓展至时空域，实现对输入数据在空间与时间两个维度上共同隐藏的动作相关信息源的联合分析。受人体骨骼图结构的启发，我们进一步提出一种基于树结构的更高效遍历方法。为应对三维骨骼数据中存在的噪声与遮挡问题，我们在LSTM中引入了一种新型门控机制，用以学习序列输入数据的可靠性，并据此动态调整其对存储于记忆单元中的长期上下文信息更新的影响。所提出的方法在四个具有挑战性的三维人体动作分析基准数据集上均取得了当前最优的性能表现。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供