
摘要
在生成对抗网络(GANs)中,一种广泛采用的提升性能的启发式方法是为判别器施加某种形式的梯度惩罚。这一梯度惩罚最初源于Wasserstein距离的理论框架。然而,该方法在其他GAN架构中的应用缺乏充分的理论依据。本文提出一个统一的期望间隔最大化(expected margin maximization)框架,证明了多种梯度惩罚GAN(如Wasserstein GAN、标准GAN、最小二乘GAN和Hinge GAN)均可由此框架推导得出。我们的研究结果表明,引入梯度惩罚实际上促使判别器成为一个大间隔分类器(即在GAN中表现为大间隔判别器)。我们进一步阐述了期望间隔最大化如何缓解生成样本(假样本)处梯度消失这一GAN中的经典难题。基于该统一框架,我们提出一种结合Hinge损失的$L^\infty$梯度范数惩罚方法,实验表明,该方法在生成质量上通常可达到甚至优于传统的$L^2$范数惩罚(以Fréchet inception距离为评价指标)。
代码仓库
lucidrains/stylegan2-pytorch
pytorch
GitHub 中提及
AlexiaJM/MaximumMarginGANs
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-cifar-10 | HingeGAN | FID: 27.12 |