8 个月前

卷积神经网络

计算机视觉

计算机视觉

Ziyu Liu Hongwen Zhang Zhenghao Chen Zhiyong Wang Wanli Ouyang

摘要

时空图已被广泛应用于基于骨架的动作识别算法中，以建模人类动作动态。为了从这些图中捕捉到稳健的运动模式，长程和多尺度上下文聚合以及时空依赖性建模是强大特征提取器的关键方面。然而，现有方法在实现（1）无偏的多尺度关节关系建模和（2）无障碍的跨时空信息流以捕捉复杂的时空依赖性方面存在局限性。在这项工作中，我们提出了（1）一种简单的多尺度图卷积解耦方法和（2）一种统一的时空图卷积算子，命名为G3D。所提出的多尺度聚合方案解耦了不同邻域节点的重要性，从而实现了有效的长程建模。所提出的G3D模块利用密集的跨时空边作为跳过连接，实现时空图中的直接信息传播。通过结合这些提议，我们开发了一种强大的特征提取器MS-G3D，在此基础上我们的模型在三个大规模数据集上超越了以往的最先进方法：NTU RGB+D 60、NTU RGB+D 120 和 Kinetics Skeleton 400。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

卷积神经网络

计算机视觉

计算机视觉

Ziyu Liu Hongwen Zhang Zhenghao Chen Zhiyong Wang Wanli Ouyang

摘要

时空图已被广泛应用于基于骨架的动作识别算法中，以建模人类动作动态。为了从这些图中捕捉到稳健的运动模式，长程和多尺度上下文聚合以及时空依赖性建模是强大特征提取器的关键方面。然而，现有方法在实现（1）无偏的多尺度关节关系建模和（2）无障碍的跨时空信息流以捕捉复杂的时空依赖性方面存在局限性。在这项工作中，我们提出了（1）一种简单的多尺度图卷积解耦方法和（2）一种统一的时空图卷积算子，命名为G3D。所提出的多尺度聚合方案解耦了不同邻域节点的重要性，从而实现了有效的长程建模。所提出的G3D模块利用密集的跨时空边作为跳过连接，实现时空图中的直接信息传播。通过结合这些提议，我们开发了一种强大的特征提取器MS-G3D，在此基础上我们的模型在三个大规模数据集上超越了以往的最先进方法：NTU RGB+D 60、NTU RGB+D 120 和 Kinetics Skeleton 400。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供