
摘要
尽管生成对抗网络(GANs)在各种任务中取得了显著的成功,但在生成高质量图像方面仍面临挑战。本文提出了一种堆叠生成对抗网络(StackGAN),旨在生成高分辨率的照片级真实图像。首先,我们提出了一种两阶段生成对抗网络架构——StackGAN-v1,用于从文本到图像的合成。第一阶段的GAN根据给定的文本描述绘制对象的基本形状和颜色,生成低分辨率图像。第二阶段的GAN以第一阶段的结果和文本描述为输入,生成具有照片级真实细节的高分辨率图像。其次,我们提出了一种先进的多阶段生成对抗网络架构——StackGAN-v2,适用于条件性和非条件性生成任务。我们的StackGAN-v2由多个生成器和判别器组成,呈树状结构;不同分支生成同一场景的多尺度图像。通过联合逼近多个分布,StackGAN-v2比StackGAN-v1表现出更稳定的训练行为。大量实验表明,所提出的堆叠生成对抗网络在生成照片级真实图像方面显著优于其他最先进方法。
代码仓库
Maymaher/StackGANv2
pytorch
GitHub 中提及
rightlit/StackGAN-v2-rev
pytorch
GitHub 中提及
taoxugit/AttnGAN
pytorch
GitHub 中提及
hiarsal/dae-gan
pytorch
GitHub 中提及
davidstap/AttnGAN
pytorch
GitHub 中提及
komiya-m/MirrorGAN
pytorch
GitHub 中提及
kkanshul/finegan
pytorch
GitHub 中提及
hanzhanggit/StackGAN
官方
tf
GitHub 中提及
senmaoy/recurrent-affine-transformation-for-text-to-image-synthesis
pytorch
GitHub 中提及
pioneerAlpha/BanglaText2ImageGeneration
pytorch
GitHub 中提及
priscillalui/StackGAN-Stories
pytorch
GitHub 中提及
hanzhanggit/StackGAN-Pytorch
pytorch
GitHub 中提及
tobran/DF-GAN
pytorch
GitHub 中提及
akanimax/T2F
pytorch
GitHub 中提及
Vigneshthanga/stackGAN-v2
pytorch
GitHub 中提及
hanzhanggit/StackGAN-v2
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-lsun-bedroom-256-x-256 | StackGAN-v2 | FID: 35.61 |
| text-to-image-generation-on-coco | StackGAN-v1 | FID: 74.05 Inception score: 8.45 |
| text-to-image-generation-on-cub | StackGAN-v2 | FID: 15.3 Inception score: 3.82 |
| text-to-image-generation-on-cub | StackGAN-v1 | FID: 51.89 Inception score: 3.7 |
| text-to-image-generation-on-oxford-102 | StackGAN-v1 | FID: 55.28 Inception score: 3.2 |
| text-to-image-generation-on-oxford-102 | StackGAN-v2 | FID: 48.68 Inception score: 3.26 |