3 个月前

从最大间隔角度出发的梯度惩罚

Alexia Jolicoeur-Martineau Ioannis Mitliagkas

摘要

在生成对抗网络（GANs）中，一种广泛采用的提升性能的启发式方法是为判别器施加某种形式的梯度惩罚。这一梯度惩罚最初源于Wasserstein距离的理论框架。然而，该方法在其他GAN架构中的应用缺乏充分的理论依据。本文提出一个统一的期望间隔最大化（expected margin maximization）框架，证明了多种梯度惩罚GAN（如Wasserstein GAN、标准GAN、最小二乘GAN和Hinge GAN）均可由此框架推导得出。我们的研究结果表明，引入梯度惩罚实际上促使判别器成为一个大间隔分类器（即在GAN中表现为大间隔判别器）。我们进一步阐述了期望间隔最大化如何缓解生成样本（假样本）处梯度消失这一GAN中的经典难题。基于该统一框架，我们提出一种结合Hinge损失的$L^\infty$梯度范数惩罚方法，实验表明，该方法在生成质量上通常可达到甚至优于传统的$L^2$范数惩罚（以Fréchet inception距离为评价指标）。

代码仓库

lucidrains/stylegan2-pytorch

pytorch

GitHub 中提及

AlexiaJM/MaximumMarginGANs

官方

GitHub 中提及

基准测试

基准	方法	指标
image-generation-on-cifar-10	HingeGAN	FID: 27.12

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供