4 个月前

使用2D-CNN生成时空表征的HalluciNet方法

使用2D-CNN生成时空表征的HalluciNet方法

摘要

使用三维卷积神经网络(3D-CNN)学习到的时空表示目前在最先进的动作相关任务中得到了广泛应用。然而,与更为简单的二维卷积神经网络(2D-CNN)架构相比,3D-CNN以消耗大量内存和计算资源而著称。本文提出了一种方法,通过让一个2D-CNN学生模型从3D-CNN教师模型中“幻觉”出时空表示来解决这一问题。通过要求2D-CNN预测未来并直观地推断即将发生的活动,该方法鼓励其对动作及其演变获得更深入的理解。幻觉任务被视为辅助任务,在多任务学习设置中可以与其他任何动作相关任务结合使用。详尽的实验评估表明,幻觉任务确实有助于提高动作识别、动作质量评估和动态场景识别任务的性能。从实际应用的角度来看,能够在没有实际3D-CNN的情况下“幻觉”出时空表示,可以实现在资源受限的场景中的部署,例如计算能力有限和/或带宽较低的情况。代码库可在此处获取:https://github.com/ParitoshParmar/HalluciNet。

代码仓库

ParitoshParmar/HalluciNet--PyTorch
pytorch
GitHub 中提及
ParitoshParmar/HalluciNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
action-recognition-in-videos-on-ucf101HalluciNet (ResNet-50)
3-fold Accuracy: 79.83
scene-recognition-on-yupHalluciNet (ResNet-50)
Accuracy (%): 84.44

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用2D-CNN生成时空表征的HalluciNet方法 | 论文 | HyperAI超神经