4 个月前

SPiKE:从点云序列中提取3D人体姿态

SPiKE:从点云序列中提取3D人体姿态

摘要

三维人体姿态估计(3D Human Pose Estimation, HPE)是从二维或三维表示(如RGB图像、深度图或点云)中定位人体关键点在三维空间中的位置的任务。目前,基于深度图和点云的HPE方法主要依赖于单帧估计,未能充分利用序列中的时间信息。本文介绍了一种新的3D HPE方法——SPiKE,该方法利用点云序列进行姿态估计。与现有方法独立处理序列中的每一帧不同,SPiKE通过采用Transformer架构来编码整个序列中各点之间的时空关系,从而利用时间上下文。通过将点云划分为局部体积并使用点空间卷积进行空间特征提取,SPiKE确保了Transformer在高效处理的同时保留了每个时间戳的空间完整性。在ITOP基准测试上的实验表明,SPiKE达到了89.19%的平均精度(mAP),以显著更低的推理时间实现了当前最佳性能。广泛的消融实验进一步验证了时间信息利用和我们算法选择的有效性。代码和模型可在以下地址获取:https://github.com/iballester/SPiKE

代码仓库

iballester/SPiKE
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-human-pose-estimation-on-itop-front-view-1SPiKE
Mean mAP: 89.19
pose-estimation-on-itop-front-viewSPiKE
Mean mAP: 89.19

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SPiKE:从点云序列中提取3D人体姿态 | 论文 | HyperAI超神经