6 个月前

计算机视觉

计算机视觉

Adrian Holzbock Alexander Tsaregorodtsev Youssef Dawoud Klaus Dietmayer Vasileios Belagiannis

摘要

手势识别对于自动驾驶车辆与人类的交互至关重要。尽管当前多数方法侧重于融合多种模态数据（如图像特征、关键点信息和骨骼向量），本文提出了一种仅依赖人体骨骼数据输入的神经网络架构，并在该条件下实现了当前最优的识别性能。我们提出了面向自动驾驶场景下的时空多层感知机（Spatio-Temporal Multilayer Perceptron）用于手势识别。在给定随时间演化的三维人体姿态序列基础上，我们设计了时空混合操作，以在时间和空间两个维度上有效提取特征。此外，通过引入Squeeze-and-Excitation模块，对每个时间步的重要性进行动态重加权，进一步提升模型对关键时序信息的感知能力。本文在TCG和Drive&Act两个数据集上进行了全面的实验评估，充分展示了所提方法的优异性能。此外，我们将该模型部署于实际自动驾驶车辆平台，验证了其在真实场景下的实时性与稳定运行能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

计算机视觉

Adrian Holzbock Alexander Tsaregorodtsev Youssef Dawoud Klaus Dietmayer Vasileios Belagiannis

摘要

手势识别对于自动驾驶车辆与人类的交互至关重要。尽管当前多数方法侧重于融合多种模态数据（如图像特征、关键点信息和骨骼向量），本文提出了一种仅依赖人体骨骼数据输入的神经网络架构，并在该条件下实现了当前最优的识别性能。我们提出了面向自动驾驶场景下的时空多层感知机（Spatio-Temporal Multilayer Perceptron）用于手势识别。在给定随时间演化的三维人体姿态序列基础上，我们设计了时空混合操作，以在时间和空间两个维度上有效提取特征。此外，通过引入Squeeze-and-Excitation模块，对每个时间步的重要性进行动态重加权，进一步提升模型对关键时序信息的感知能力。本文在TCG和Drive&Act两个数据集上进行了全面的实验评估，充分展示了所提方法的优异性能。此外，我们将该模型部署于实际自动驾驶车辆平台，验证了其在真实场景下的实时性与稳定运行能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供