3 个月前

基于判别器引导的得分函数扩散模型生成过程优化

基于判别器引导的得分函数扩散模型生成过程优化

摘要

所提出的“判别器引导”(Discriminator Guidance)方法旨在提升预训练扩散模型的样本生成质量。该方法引入一个判别器,对去噪样本路径是否具有真实性提供显式监督。与生成对抗网络(GANs)不同,本方法无需联合训练得分网络与判别器网络。相反,我们先完成得分网络的训练,再单独训练判别器,从而确保判别器训练过程稳定且收敛迅速。在样本生成阶段,我们在预训练得分函数中添加一个辅助项,以欺骗判别器。该辅助项可将模型得分修正为在最优判别器下的数据得分,表明判别器以互补方式提升了得分估计的准确性。基于该算法,我们在 ImageNet 256×256 数据集上取得了当前最优的生成效果,FID 达到 1.83,召回率(recall)为 0.64,与验证集的 FID(1.68)和召回率(0.66)极为接近。相关代码已开源,地址为:https://github.com/alsdudrla10/DG。

代码仓库

alsdudrla10/DG
官方
pytorch
GitHub 中提及
alsdudrla10/DG_imagenet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
conditional-image-generation-on-cifar-10EDM-G++ (conditional)
FID: 1.64
image-generation-on-celeba-64x64STDDPM-G++
FID: 1.34
image-generation-on-cifar-10Discriminator Guidance (unconditional)
FID: 1.77
image-generation-on-imagenet-256x256ADM-G++ (Recall)
FID: 4.45
image-generation-on-imagenet-256x256Discriminator Guidance
FID: 1.83
image-generation-on-imagenet-256x256ADM-G++ (FID)
FID: 3.18

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于判别器引导的得分函数扩散模型生成过程优化 | 论文 | HyperAI超神经