3 个月前

Bubblenet:一种用于识别活动的分散循环结构

Bubblenet:一种用于识别活动的分散循环结构

摘要

本文提出了一种基于深度循环网络的人体动作识别方法,该方法以视频的外观特征和光流信息作为输入。所提出的方法设计了一种名为BubbleNET的新架构,其核心结构为将循环层分解为多个模块(称为“气泡”),并引入基于挤压-激励(squeeze-and-excitation)策略的注意力机制,用于动态调节各“气泡”模块的贡献权重。该设计旨在从输入数据中捕捉本质上相关的时间片段信息,从而构建出能够表征各类动作的特征组合模式。在多个广泛使用的动作识别数据集上开展的实验验证了此类特征模式的存在,其表现可通过各类别对应的“气泡激活图”得以直观体现。为与现有文献方法进行对比,本文采用平均准确率作为评价指标,结果显示,BubbleNET在UCF-101、YUP++和HMDB-51数据集上的准确率分别为97.62%、91.70%和82.60%,性能处于当前先进水平。

基准测试

基准方法指标
action-recognition-in-videos-on-hmdb-51BubbleNET
Average accuracy of 3 splits: 82.60
action-recognition-in-videos-on-ucf101BubbleNET
3-fold Accuracy: 97.62

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Bubblenet:一种用于识别活动的分散循环结构 | 论文 | HyperAI超神经