3 个月前

基于U-Net的生成对抗网络判别器

基于U-Net的生成对抗网络判别器

摘要

生成对抗网络(GANs)目前面临的重大挑战之一,是如何生成在全局和局部上均具一致性的图像,且其物体形状与纹理与真实图像难以区分。为解决这一问题,我们提出了一种基于U-Net的新型判别器架构,其设计灵感来源于图像分割领域的研究成果。该U-Net架构在保持生成图像全局一致性的同时,能够向生成器提供精细化的逐像素反馈。通过同时提供全局图像级反馈,该架构实现了对生成图像在整体结构与局部细节上的双重约束。在判别器具备逐像素响应能力的基础上,我们进一步提出一种基于CutMix数据增强的逐像素一致性正则化方法,旨在引导U-Net判别器更关注真实图像与生成图像之间在语义和结构层面的差异。该正则化策略有效提升了U-Net判别器的训练稳定性与判别能力,从而进一步改善生成样本的质量。所提出的新型判别器在标准分布度量与图像质量指标上均显著优于现有最先进方法,使生成器能够合成具有多样化结构、外观及细节层次的图像,同时在全局与局部层面均保持高度真实感。与BigGAN基线模型相比,我们在FFHQ、CelebA以及新引入的COCO-Animals数据集上实现了平均2.7个FID分数的提升。相关代码已开源,地址为:https://github.com/boschresearch/unetgan。

基准测试

基准方法指标
conditional-image-generation-on-coco-animalsU-Net GAN
FID: 13.73
IS: 12.29
conditional-image-generation-on-coco-animalsBigGAN
FID: 16.37
IS: 11.77
image-generation-on-celeba-128x128U-Net GAN
FID: 2.95
Inception score: 3.43
image-generation-on-celeba-hq-128x128U-Net GAN
FID: 2.03
Inception score: 3.33
image-generation-on-ffhq-256-x-256BigGAN
FID: 11.48
image-generation-on-ffhq-256-x-256U-Net GAN
FID: 7.48

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于U-Net的生成对抗网络判别器 | 论文 | HyperAI超神经