3 个月前

基于分层上下文改进时间动作提案

基于分层上下文改进时间动作提案

摘要

时间动作提议(Temporal Action Proposal, TAP)旨在从未剪辑的视频中生成准确的动作实例候选。已有研究表明,上下文信息在该任务中至关重要。本文提出一种新型的分层上下文网络(Hierarchical Context Network, HCN),以进一步挖掘片段级(snippet-level)和提议级(proposal-level)上下文信息,分别用于提升片段与提议的表征能力。首先,我们发现不同尺度的片段级上下文对不同类型的动作实例的重要性并不相同。为此,我们在U-Net结构中引入一种新颖的门控机制,以自适应地捕捉与内容相关的片段级上下文信息。其次,为有效利用提议级上下文,我们设计了一种高效的任务特定自注意力模型。通过堆叠多个此类注意力模块,可广泛而深入地探索提议级上下文关系。最后,为充分融合两个层次的上下文信息,HCN采用三条并行分支,从局部到全局多个视角对候选动作进行评估。在ActivityNet-1.3和THUMOS14数据集上的实验结果表明,HCN显著优于以往的TAP方法。此外,进一步实验表明,将本方法与现有的动作分类器结合后,可显著提升当前最优动作检测模型的性能。

基准测试

基准方法指标
temporal-action-localization-on-activitynetHCN(I3D features)
mAP: 35.61
mAP IOU@0.5: 52.51
mAP IOU@0.75: 36.10
mAP IOU@0.95: 7.12
temporal-action-proposal-generation-onHCN
AR@100: 77.13
AUC (val): 68.78
temporal-action-proposal-generation-on-thumosHCH
AR@100: 50.86
AR@1000: 67.34
AR@200: 57.56
AR@50: 64.28

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于分层上下文改进时间动作提案 | 论文 | HyperAI超神经