4 个月前

CTAP:互补时间动作提案生成

CTAP:互补时间动作提案生成

摘要

时间动作提议生成是一项重要的任务,类似于对象提议,时间动作提议旨在捕捉视频中可能包含动作的“片段”或时间区间。以往的方法可以分为两类:滑动窗口排序和动作性得分分组。滑动窗口均匀覆盖视频中的所有段落,但时间边界不够精确;基于分组的方法可能具有更精确的边界,但在动作性得分质量较低时可能会遗漏一些提议。基于这两种方法的互补特性,我们提出了一种新颖的时间动作提议生成器(Complementary Temporal Action Proposal, CTAP)。具体而言,我们在滑动窗口提议上应用了一个提案级动作可信度评估器(Proposal-level Actionness Trustworthiness Estimator, PATE),以生成表示通过动作性得分是否能正确检测到动作的概率,得分较高的窗口被收集起来。然后,收集的滑动窗口和动作性提议通过一个时间卷积神经网络进行提案排序和边界调整。在 THUMOS-14 和 ActivityNet 1.3 数据集上,CTAP 在平均召回率(Average Recall, AR)方面显著优于现有方法。此外,我们将 CTAP 作为提议生成方法应用于现有的动作检测器中,并展示了持续且显著的改进效果。

代码仓库

jiyanggao/CTAP
官方
tf
GitHub 中提及

基准测试

基准方法指标
temporal-action-proposal-generation-onCTAP
AR@100: 73.17
AUC (val): 65.72

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CTAP:互补时间动作提案生成 | 论文 | HyperAI超神经