4 个月前

生成具有场景动态的视频

生成具有场景动态的视频

摘要

我们利用大量未标注的视频数据来学习场景动态模型,以应用于视频识别任务(如动作分类)和视频生成任务(如未来预测)。本文提出了一种具有时空卷积架构的生成对抗网络,该网络能够将场景的前景与背景分离。实验结果表明,该模型在全帧率下可以比简单的基线方法更好地生成长达一秒的微型视频,并且我们展示了其在静态图像未来预测中的实用性。此外,通过实验和可视化分析,该模型内部能够在最少监督的情况下学习到有用的特征以识别动作,这表明场景动态是表示学习的一个有前途的信号。我们认为生成式视频模型将在视频理解和模拟的许多应用中产生重要影响。

基准测试

基准方法指标
self-supervised-action-recognition-on-ucf101VideoGan (C3D)
3-fold Accuracy: 52.1
Frozen: false
Pre-Training Dataset: UCF101
video-generation-on-ucf-101-16-framesVGAN
Inception Score: 8.18
video-generation-on-ucf-101-16-frames-64x64VGAN
Inception Score: 8.18

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
生成具有场景动态的视频 | 论文 | HyperAI超神经