4 个月前

DeciWatch:一种简单基线方法,实现2D和3D姿态估计效率提升10倍

DeciWatch:一种简单基线方法,实现2D和3D姿态估计效率提升10倍

摘要

本文提出了一种用于基于视频的2D/3D人体姿态估计的简单基线框架,该框架在不降低性能的情况下,比现有方法提高了10倍的效率,命名为DeciWatch。与当前逐帧估计视频中每一帧的方法不同,DeciWatch引入了一种简单而有效的采样-去噪-恢复框架,仅对稀疏采样的帧进行详细估计,利用了人体运动的连续性和轻量级的姿态表示。具体而言,DeciWatch均匀采样少于10%的视频帧进行详细估计,使用高效的Transformer架构对估计的2D/3D姿态进行去噪,然后通过另一个基于Transformer的网络准确恢复其余帧。在三个基于视频的人体姿态估计和身体网格恢复任务中,使用四个数据集进行的全面实验结果验证了DeciWatch的高效性和有效性。代码可在https://github.com/cure-lab/DeciWatch 获取。

代码仓库

cure-lab/DeciWatch
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
2d-human-pose-estimation-on-jhmdb-2d-posesDeciWatch
PCK: 98.8
3d-human-pose-estimation-on-3dpwDeciWatch-PARE
MPJPE: 75.5
PA-MPJPE: 46.4
3d-human-pose-estimation-on-aistDeciWatch
MPJPE: 67.2
Single-view: Y
3d-human-pose-estimation-on-human36mDeciWatch
Average MPJPE (mm): 53.1
pose-estimation-on-j-hmdbDeciWatch
Mean PCK@0.05: 80.6
Mean PCK@0.1: 94.6
Mean PCK@0.2: 99.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DeciWatch:一种简单基线方法,实现2D和3D姿态估计效率提升10倍 | 论文 | HyperAI超神经