3 个月前

基于骨架的动作识别的通道感知拓扑优化图卷积

基于骨架的动作识别的通道感知拓扑优化图卷积

摘要

图卷积网络(Graph Convolutional Networks, GCNs)在基于骨架的动作识别任务中得到了广泛应用,并取得了显著成果。在GCNs中,图结构拓扑决定了特征聚合的方式,因而成为提取具有代表性的特征的关键因素。本文提出一种新型的通道感知拓扑优化图卷积模块(Channel-wise Topology Refinement Graph Convolution, CTR-GC),旨在动态学习不同的拓扑结构,并在不同通道中高效聚合关节特征,以提升基于骨架的动作识别性能。所提出的CTR-GC通过学习一个共享的通用拓扑作为所有通道的先验信息,并针对每个通道进一步利用其特有的相关性进行拓扑优化,从而建模通道级别的拓扑结构。该优化方法引入的额外参数极少,显著降低了建模通道级拓扑结构的复杂性。此外,通过将图卷积操作统一形式化,我们发现CTR-GC能够缓解传统图卷积对拓扑结构的严格约束,从而赋予模型更强的表征能力。将CTR-GC与时间建模模块相结合,我们构建了一种性能强大的图卷积网络——CTR-GCN。在NTU RGB+D、NTU RGB+D 120以及NW-UCLA等多个主流数据集上的实验结果表明,CTR-GCN显著优于当前最先进的方法,展现出卓越的识别性能。

代码仓库

Uason-Chen/CTR-GCN
官方
pytorch
GitHub 中提及
kennymckormick/pyskl
pytorch
GitHub 中提及

基准测试

基准方法指标
skeleton-based-action-recognition-on-n-uclaCTR-GCN
Accuracy: 96.5
skeleton-based-action-recognition-on-ntu-rgbdCTR-GCN
Accuracy (CS): 92.4
Accuracy (CV): 96.8
Ensembled Modalities: 4
skeleton-based-action-recognition-on-ntu-rgbd-1CTR-GCN
Accuracy (Cross-Setup): 90.6
Accuracy (Cross-Subject): 88.9
Ensembled Modalities: 4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于骨架的动作识别的通道感知拓扑优化图卷积 | 论文 | HyperAI超神经