4 个月前

BMN:用于时间动作提案生成的边界匹配网络

BMN:用于时间动作提案生成的边界匹配网络

摘要

时间动作提议生成是一项具有挑战性和前景的任务,旨在定位现实世界视频中可能发生动作或事件的时间区域。当前自下而上的提议生成方法可以生成边界精确的提议,但无法高效地为检索提议生成足够可靠的置信度分数。为了解决这些难题,我们引入了边界匹配(Boundary-Matching, BM)机制来评估密集分布的提议的置信度分数,该机制将一个提议表示为起始和结束边界的匹配对,并将所有密集分布的BM对组合成BM置信度图。基于BM机制,我们提出了一种有效、高效且端到端的提议生成方法,称为边界匹配网络(Boundary-Matching Network, BMN),该方法可以同时生成时间边界精确的提议及其可靠的置信度分数。BMN的两个分支在一个统一的框架中联合训练。我们在两个具有挑战性的数据集上进行了实验:THUMOS-14和ActivityNet-1.3,在这些数据集中,BMN展示了显著的性能提升,并且具有出色的效率和泛化能力。此外,结合现有的动作分类器,BMN可以实现最先进的时间动作检测性能。

基准测试

基准方法指标
action-recognition-in-videos-on-thumos14BMN
mAP@0.3: 56.0
mAP@0.4: 47.4
mAP@0.5: 38.8
temporal-action-localization-on-activitynetBMN
mAP: 33.85
mAP IOU@0.5: 50.07
mAP IOU@0.75: 34.78
mAP IOU@0.95: 8.29
temporal-action-localization-on-epic-kitchensBMN (verb)
Avg mAP (0.1-0.5): 8.4
mAP IOU@0.1: 10.8
mAP IOU@0.2: 9.8
mAP IOU@0.3: 8.4
mAP IOU@0.4: 7.1
mAP IOU@0.5: 5.6
temporal-action-localization-on-fineactionBMN (i3d feaure)
mAP: 9.25
mAP IOU@0.5: 14.44
mAP IOU@0.75: 8.92
mAP IOU@0.95: 3.12
temporal-action-localization-on-thumos14BMN
mAP IOU@0.5: 32.2
temporal-action-proposal-generation-onBMN
AR@100: 75.01
AUC (val): 67.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
BMN:用于时间动作提案生成的边界匹配网络 | 论文 | HyperAI超神经