4 个月前

CERN:用于群体活动识别的置信-能量循环网络

CERN:用于群体活动识别的置信-能量循环网络

摘要

这项研究旨在识别视频中不同语义层次的人类活动,包括个人动作、互动和群体活动。通过使用两级层次的长短期记忆(LSTM)网络构建前馈深度架构来实现这一目标,该架构可以进行端到端训练。与现有的LSTM架构相比,我们在方法上做出了两项关键贡献,因此将其命名为置信能量递归网络(Confidence-Energy Recurrent Network,CERN)。首先,我们没有使用常见的softmax层进行预测,而是设计了一种新的能量层(Energy Layer,EL)来估计预测的能量值。其次,我们没有采用常见的最小能量类别分配方法(在不确定性条件下可能数值不稳定),而是规定EL还计算解的p值,从而估算最可信的能量最小值。在Collective Activity和Volleyball数据集上的评估表明:(i) 我们的两项贡献相对于常用的softmax和能量最小化公式具有优势;(ii) 与现有最先进的方法相比,我们的性能更为优越。

基准测试

基准方法指标
group-activity-recognition-on-volleyballShu et al.
Accuracy: 83.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CERN:用于群体活动识别的置信-能量循环网络 | 论文 | HyperAI超神经