4 个月前

GateHUB:用于在线动作检测的门控历史单元与背景抑制

GateHUB:用于在线动作检测的门控历史单元与背景抑制

摘要

在线动作检测是指在流媒体视频中尽可能快地预测出正在发生的动作。主要挑战在于模型无法获取未来的信息,只能依赖于历史信息,即迄今为止观察到的帧来做出预测。因此,强调对当前帧预测更有信息量的历史部分变得尤为重要。我们提出了GateHUB(带背景抑制的门控历史单元),该方法包含一种新颖的位置引导门控交叉注意力机制,用于根据历史部分对当前帧预测的信息量来增强或抑制这些部分。GateHUB进一步提出了Future-augmented History(FaH)方法,在后续帧可用时利用它们使历史特征更具信息量。在单一统一框架下,GateHUB结合了变压器在长程时间建模方面的能力和递归模型选择性编码相关信息的能力。此外,GateHUB引入了背景抑制目标,以进一步减少与动作帧非常相似的虚假正背景帧的影响。在THUMOS、TVSeries和HDD三个基准数据集上的广泛验证表明,GateHUB显著优于所有现有方法,并且比现有的最佳工作更加高效。此外,无需光流信息的GateHUB版本能够在比所有需要RGB和光流信息进行预测的现有方法高2.8倍的帧率下实现更高的或接近的准确性。

基准测试

基准方法指标
online-action-detection-on-thumos-14GateHUB (RGB only)
mAP: 66.5
online-action-detection-on-thumos-14GateHUB
mAP: 70.7
online-action-detection-on-thumos-14GateHUB(TimeSformer)
mAP: 72.5
online-action-detection-on-tvseriesGateHUB
mCAP: 89.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
GateHUB:用于在线动作检测的门控历史单元与背景抑制 | 论文 | HyperAI超神经