
摘要
条件生成对抗网络(cGAN)是一种生成高质量图像的强大工具,但现有方法普遍存在性能不佳或模式崩溃(mode collapse)的风险。本文提出Omni-GAN,一种cGAN的改进变体,揭示了在训练过程中设计有效判别器的关键挑战。其核心思想在于:确保判别器获得充分的监督以准确感知语义概念,同时施加适度的正则化以防止模型崩溃。Omni-GAN实现简单,可无缝集成现有的各类编码方法(如隐式神经表示,INR)。实验结果表明,Omni-GAN及其与INR结合的Omni-INR-GAN在多种图像生成与修复任务中均展现出卓越性能。特别地,Omni-INR-GAN在ImageNet数据集上创造了新的纪录,分别在128×128和256×256图像尺寸下取得了262.85和343.22的Inception分数,较此前最佳记录提升超过100分。此外,得益于生成器先验能力,Omni-INR-GAN可将低分辨率图像外推至任意高分辨率,最高可达原始分辨率的60倍以上。代码已开源。
代码仓库
gcervantes8/Game-Image-Generator
pytorch
GitHub 中提及
PeterouZh/Omni-GAN-PyTorch
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| conditional-image-generation-on-imagenet | Omni-GAN | FID: 8.30 Inception score: 190.94 |
| conditional-image-generation-on-imagenet | Omni-INR-GAN | FID: 6.53 Inception score: 262.85 |