
摘要
我们介绍了UCF101,这是目前最大的人类动作数据集。该数据集包含101个动作类别,超过13,000段视频片段和27小时的视频数据。数据库中的视频均为用户上传的真实场景视频,包含摄像机运动和杂乱背景。此外,我们提供了基于标准词袋模型(bag of words)在这一新数据集上的基准动作识别结果,总体性能为44.5%。据我们所知,由于其类别数量庞大、片段数量众多以及这些片段的无约束性质,UCF101目前是最具挑战性的动作数据集。
代码仓库
doronharitan/human_activity_recognition_LRCN
pytorch
GitHub 中提及
rlaengud123/CMC_LRCN
pytorch
GitHub 中提及
mcgridles/LENS
pytorch
GitHub 中提及
ryanchesler/comma-speed-challenge
tf
GitHub 中提及
Alexyuda/action_recognition
pytorch
GitHub 中提及
niveditarahurkar/CS231N-ActionRecognition
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| action-recognition-in-videos-on-ucf101-2 | Baseline UCF101 | 3-fold Accuracy: 43.9 |