3 个月前

从RGB-D视频中学习时空结构以实现人体活动检测与预测

从RGB-D视频中学习时空结构以实现人体活动检测与预测

摘要

我们研究的是检测过去行为以及预测未来将发生的行为及其具体方式的问题。为此,我们首先利用条件随机场(CRF)对人姿态与物体之间的丰富时空关系(即“可供性”)进行建模。然而,由于构成某一行为的子活动在时间上的分割存在歧义,无论是过去还是未来,都可能存在多种可能的图结构。本文中,我们通过在多种可能的图结构之间进行推理,来应对这些替代可能性。我们通过仅使用加性特征对图结构进行近似,从而实现高效的动态规划。在初始图结构的基础上,我们进一步设计了若干变换操作,以生成多个合理的其他图结构。实验结果表明,该方法在120段由四位受试者采集的活动视频数据集上,显著提升了过去行为检测与未来行为预测的性能,达到了当前最先进的水平。

基准测试

基准方法指标
skeleton-based-action-recognition-on-cad-120All Features (w ground truth)
Accuracy: 89.3%
skeleton-based-action-recognition-on-cad-120Our DP seg. + moves + heuristic seg.
Accuracy: 70.3%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从RGB-D视频中学习时空结构以实现人体活动检测与预测 | 论文 | HyperAI超神经