4 个月前

基于骨架的动作识别模型:更小、更快、更好

基于骨架的动作识别模型:更小、更快、更好

摘要

尽管基于骨架的动作识别在近年来取得了显著成功,但现有的大多数方法仍可能面临模型体积庞大和执行速度缓慢的问题。为了解决这一问题,我们分析了骨架序列的特性,提出了一种双特征双运动网络(Double-feature Double-motion Network, DD-Net)用于基于骨架的动作识别。通过采用轻量级网络结构(即0.15百万参数),DD-Net能够实现极高的运行速度,在单个GPU上可达3,500帧每秒(FPS),在单个CPU上可达2,000帧每秒(FPS)。通过使用鲁棒特征,DD-Net在我们的实验数据集SHREC(即手部动作)和JHMDB(即身体动作)上达到了最先进的性能。我们的代码将在本文后续发布。

代码仓库

fandulu/DD-Net
官方
tf
GitHub 中提及
paty0504/SIGNTEGRATE
tf
GitHub 中提及

基准测试

基准方法指标
hand-gesture-recognition-on-dhg-14DD-Net
Accuracy: 94.6
hand-gesture-recognition-on-dhg-28DD-Net
Accuracy: 91.9
hand-gesture-recognition-on-shrec-2017-trackDD-Net
14 gestures accuracy: 94.6
skeleton-based-action-recognition-on-j-hmdbDD-Net
Accuracy (RGB+pose): -
Accuracy (pose): 77.2
skeleton-based-action-recognition-on-jhmdb-2dDD-Net
Accuracy: 78.0 (average of 3 split train/test)
Average accuracy of 3 splits: 77.2
No. parameters: 1.82 M

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于骨架的动作识别模型:更小、更快、更好 | 论文 | HyperAI超神经