3 个月前

从最大间隔角度出发的梯度惩罚

从最大间隔角度出发的梯度惩罚

摘要

在生成对抗网络(GANs)中,一种广泛采用的提升性能的启发式方法是为判别器施加某种形式的梯度惩罚。这一梯度惩罚最初源于Wasserstein距离的理论框架。然而,该方法在其他GAN架构中的应用缺乏充分的理论依据。本文提出一个统一的期望间隔最大化(expected margin maximization)框架,证明了多种梯度惩罚GAN(如Wasserstein GAN、标准GAN、最小二乘GAN和Hinge GAN)均可由此框架推导得出。我们的研究结果表明,引入梯度惩罚实际上促使判别器成为一个大间隔分类器(即在GAN中表现为大间隔判别器)。我们进一步阐述了期望间隔最大化如何缓解生成样本(假样本)处梯度消失这一GAN中的经典难题。基于该统一框架,我们提出一种结合Hinge损失的$L^\infty$梯度范数惩罚方法,实验表明,该方法在生成质量上通常可达到甚至优于传统的$L^2$范数惩罚(以Fréchet inception距离为评价指标)。

代码仓库

lucidrains/stylegan2-pytorch
pytorch
GitHub 中提及
AlexiaJM/MaximumMarginGANs
官方
tf
GitHub 中提及

基准测试

基准方法指标
image-generation-on-cifar-10HingeGAN
FID: 27.12

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从最大间隔角度出发的梯度惩罚 | 论文 | HyperAI超神经