4 个月前

基于3D CNNs和注意力机制的MediaEval 2022体育任务基线方法

基于3D CNNs和注意力机制的MediaEval 2022体育任务基线方法

摘要

本文介绍了为MediaEval 2022基准测试中的体育视频任务部分提出的基线方法。该任务包含两个子任务:从剪辑视频中进行击球分类,以及从未剪辑视频中进行击球检测。本基线方法同时解决了这两个子任务。我们提出了两种类型的3D-CNN架构来解决这两个子任务。这两种3D-CNN均采用了时空卷积和注意力机制。架构和训练过程针对所解决的子任务进行了定制。该基线方法已在线公开共享,以帮助参与者在其研究过程中减轻某些方面的负担,例如视频处理、训练方法、评估和提交流程。对于分类子任务,我们的v2模型达到了86.4%的准确率。对于检测子任务,我们的v1模型达到了0.131的平均精度均值(mAP)和0.515的交并比(IoU)。

代码仓库

基准测试

基准方法指标
action-classification-on-ttstroke-21STCNN-V2 (Gaussian decision)
Acc: 0.864
action-detection-on-ttstroke-21STCNN-V2 (Vote decision)
IoU: 0.515
mAP: 0.131

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于3D CNNs和注意力机制的MediaEval 2022体育任务基线方法 | 论文 | HyperAI超神经