3 个月前

MITFAS:基于互信息的时序特征对齐与采样用于航拍视频动作识别

MITFAS:基于互信息的时序特征对齐与采样用于航拍视频动作识别

摘要

我们提出了一种针对无人机(UAV)视频中动作识别的新方法。该方法的设计旨在应对无人机运动所引起的遮挡和视角变化问题。通过引入互信息(mutual information)的概念,我们在时间域上计算并对齐与人体动作或运动相对应的区域,从而使识别模型能够学习到与运动相关的关键特征。此外,我们提出了一种新颖的帧采样方法,利用联合互信息(joint mutual information)选取无人机视频中最具信息量的帧序列,以提升模型的表征能力。我们将该方法与X3D模型相结合,并在多个公开数据集上进行了评估。实验结果表明,在UAV-Human数据集(Li et al., 2021)上,我们的方法相较当前最先进方法在Top-1准确率上提升了18.9%;在Drone-Action数据集(Perera et al., 2019)上提升了7.3%;在NEC Drones数据集(Choi et al., 2020)上提升了7.16%。

代码仓库

ricky-xian/mitfas
官方
GitHub 中提及

基准测试

基准方法指标
action-recognition-on-uav-humanMITFAS
Top 1 Accuracy: 50.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MITFAS:基于互信息的时序特征对齐与采样用于航拍视频动作识别 | 论文 | HyperAI超神经