4 个月前

卷积神经网络

计算机视觉

Kim Tae Soo Reiter Austin

摘要

当前，基于深度学习的三维人体动作识别模型的判别能力日益增强。随着近期以三维骨骼为表征的三维人体动作表示方法的复兴，相关研究在质量与进展速度上均取得了显著突破。然而，当前最先进的基于学习的三维人体动作识别方法内部机制仍大多处于“黑箱”状态。本文提出采用一类新型模型——时间卷积神经网络（Temporal Convolutional Neural Networks, TCN），用于三维人体动作识别。相较于广泛使用的基于LSTM的循环神经网络模型，在输入为可解释数据（如三维骨骼）的前提下，TCN能够显式地学习出易于理解的时空表征，从而实现对三维人体动作的可解释性识别。本文详细阐述了在设计TCN时如何兼顾可解释性，并展示了如何利用该模型的可解释特性构建出强大的三维动作识别方法。通过本研究，我们旨在迈向一种更易于理解、解释和分析的时空建模方法。所提出的模型Res-TCN在目前最大的三维人体动作识别数据集NTU-RGBD上取得了当前最优的识别性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

4 个月前

卷积神经网络

计算机视觉

Kim Tae Soo Reiter Austin

摘要

当前，基于深度学习的三维人体动作识别模型的判别能力日益增强。随着近期以三维骨骼为表征的三维人体动作表示方法的复兴，相关研究在质量与进展速度上均取得了显著突破。然而，当前最先进的基于学习的三维人体动作识别方法内部机制仍大多处于“黑箱”状态。本文提出采用一类新型模型——时间卷积神经网络（Temporal Convolutional Neural Networks, TCN），用于三维人体动作识别。相较于广泛使用的基于LSTM的循环神经网络模型，在输入为可解释数据（如三维骨骼）的前提下，TCN能够显式地学习出易于理解的时空表征，从而实现对三维人体动作的可解释性识别。本文详细阐述了在设计TCN时如何兼顾可解释性，并展示了如何利用该模型的可解释特性构建出强大的三维动作识别方法。通过本研究，我们旨在迈向一种更易于理解、解释和分析的时空建模方法。所提出的模型Res-TCN在目前最大的三维人体动作识别数据集NTU-RGBD上取得了当前最优的识别性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供