3 个月前

弱监督时序动作定位中的动作单元记忆网络

弱监督时序动作定位中的动作单元记忆网络

摘要

弱监督时序动作定位旨在仅使用视频级别标签对未剪辑视频中的动作进行检测与定位。然而,在缺乏帧级别标注的情况下,实现定位的完整性并缓解背景干扰仍面临巨大挑战。本文提出一种动作单元记忆网络(Action Unit Memory Network, AUMN),通过学习动作单元记忆库,有效缓解上述两个难题。在所提出的AUMN中,设计了两个注意力模块,用于自适应地更新记忆库并学习具有特定性的动作单元分类器。此外,还引入三种有效机制——多样性、同质性和稀疏性,以指导记忆网络的更新过程。据我们所知,这是首个显式地利用记忆网络建模动作单元的开创性工作。在两个标准基准数据集(THUMOS14 和 ActivityNet)上的大量实验结果表明,所提出的AUMN在性能上显著优于现有最先进方法。具体而言,在THUMOS14数据集上,IoU阈值从0.1到0.5的平均mAP从47.0%显著提升至52.1%。

基准测试

基准方法指标
weakly-supervised-action-localization-on-5AUMN
avg-mAP (0.1-0.5): 52.1
avg-mAP (0.1:0.7): 41.5
avg-mAP (0.3-0.7): 32.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
弱监督时序动作定位中的动作单元记忆网络 | 论文 | HyperAI超神经