3 个月前

视频判别器的低维核

视频判别器的低维核

摘要

本研究对生成对抗网络(GAN)中用于视频生成的判别器架构进行了分析。我们发现,无约束的视频判别器架构会导致损失曲面具有较高的曲率,从而使得优化过程变得困难。此外,我们还观察到,随着视频判别器最大卷积核尺寸的增加,这种曲率会进一步加剧。基于上述发现,我们提出了一类高效且低维的视频判别器家族,即用于GAN的低维视频判别器(LDVD GANs)。所提出的判别器家族在应用于各类视频GAN模型时,显著提升了模型性能,并在复杂多样的数据集(如UCF-101)上表现出色。特别地,实验表明,该方法可使时序GAN(Temporal-GAN)的性能提升一倍,并在单张GPU上实现当前最优的生成效果。

代码仓库

HappyBahman/ldvdGAN
pytorch
GitHub 中提及

基准测试

基准方法指标
video-generation-on-ucf-101-16-framesTGAN-F
Inception Score: 22.91
video-generation-on-ucf-101-16-frames-128x128TGAN-F
Inception Score: 22.91
video-generation-on-ucf-101-16-frames-64x64TGAN-F
FID: 8943
Inception Score: 13.62

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
视频判别器的低维核 | 论文 | HyperAI超神经