摘要
本文提出了一种基于信息帧时间学习的简单动作识别方法。我们设计了一种无需训练的自适应帧选择方案,仅通过时间窗口内的相似性度量技术实现帧的选择。所提出的帧选择方法能够有效捕捉具有信息量的帧,并提取具有意义的特征。此外,我们采用迁移学习进行空间特征提取,并利用LSTM与GRU进行时间建模。该方法在两个主流数据集UCF11和KTH上进行了评估,实验结果表明其具有令人满意的性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| action-recognition-on-kth | CNN-GRU | 16:9 Accuracy: 95.38 |
| action-recognition-on-ucfsports | CNN-LSTM | leave one out cross validation(LOOCV): 98.27 |