6 个月前

摘要

我们证明，扩散模型能够实现优于当前最先进生成模型的图像样本质量。在无条件图像生成任务中，我们通过一系列消融实验，发现了一种更优的网络架构，从而实现了这一目标。在条件图像生成任务中，我们进一步利用分类器引导（classifier guidance）方法提升了样本质量：这是一种简单且计算高效的策略，通过利用分类器的梯度，实现多样性与保真度之间的权衡。我们在 ImageNet 128×128 上取得了 2.97 的 FID 分数，256×256 上为 4.59，512×512 上为 7.72，即便每张样本仅需 25 次前向传播，也能达到与 BigGAN-deep 相当的性能，同时保持了对数据分布更全面的覆盖。此外，我们发现分类器引导与上采样扩散模型结合效果良好，进一步将 ImageNet 256×256 的 FID 降低至 3.94，512×512 的 FID 降低至 3.85。相关代码已开源，地址为：https://github.com/openai/guided-diffusion。

源 PDF