3 个月前

基于双流卷积神经网络与空洞循环神经网络的足球事件检测

基于双流卷积神经网络与空洞循环神经网络的足球事件检测

摘要

本文针对长时足球视频中的事件检测与定位问题展开研究。我们的核心观点是:准确实现长时足球视频中的事件定位,必须充分理解视频帧之间的长程依赖关系。此外,若不考虑相邻帧之间的中程与短程相关性,对于足球视频中快速运动的事件,其检测效果将难以保证。我们认为,通过在统一架构中综合建模从短程到长程的帧间依赖关系,可显著提升事件定位的性能。为有效建模长程与中程依赖关系,我们提出基于双流卷积神经网络(Two-stream CNN)特征,采用带有扩张门控循环单元(DilatedRNN)的长短期记忆网络(LSTM)结构。其中,双流CNN负责提取对细节刻画至关重要的局部时空特征,而DilatedRNN则能够将远距离帧所蕴含的信息有效传递给分类器与事件定位算法。在目前公开可用的最大规模足球视频基准数据集——SoccerNet上对所提事件定位算法进行评估,结果表明,相较于现有最先进方法,准确率提升达0.8%至13.6%;与基线模型相比,最高可实现30.1%的准确率增益。此外,我们通过大规模消融实验,系统分析了各神经网络组件对事件定位准确率的贡献,进一步验证了所提方法的有效性与各模块的重要性。

基准测试

基准方法指标
action-spotting-on-soccernetTwo-stream CNN + Dilated RNN (Mahaseni et al.)
Average-mAP: 63.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于双流卷积神经网络与空洞循环神经网络的足球事件检测 | 论文 | HyperAI超神经