3 个月前

用于手势识别的时空多层感知机

用于手势识别的时空多层感知机

摘要

手势识别对于自动驾驶车辆与人类的交互至关重要。尽管当前多数方法侧重于融合多种模态数据(如图像特征、关键点信息和骨骼向量),本文提出了一种仅依赖人体骨骼数据输入的神经网络架构,并在该条件下实现了当前最优的识别性能。我们提出了面向自动驾驶场景下的时空多层感知机(Spatio-Temporal Multilayer Perceptron)用于手势识别。在给定随时间演化的三维人体姿态序列基础上,我们设计了时空混合操作,以在时间和空间两个维度上有效提取特征。此外,通过引入Squeeze-and-Excitation模块,对每个时间步的重要性进行动态重加权,进一步提升模型对关键时序信息的感知能力。本文在TCG和Drive&Act两个数据集上进行了全面的实验评估,充分展示了所提方法的优异性能。此外,我们将该模型部署于实际自动驾驶车辆平台,验证了其在真实场景下的实时性与稳定运行能力。

代码仓库

holzbock/st_mlp
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
skeleton-based-action-recognition-on-drivestMLP
mean per-class accuracy: 34.61
skeleton-based-action-recognition-on-tcgstMLP
Acc: 85.99
F1-Score: 80.05
Jaccard Index: 67.88

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于手势识别的时空多层感知机 | 论文 | HyperAI超神经