
摘要
去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPM)是一类生成模型,近期已被证明能够生成高质量的样本。我们发现,通过若干简单的改进,DDPM在保持优异样本质量的同时,也能实现具有竞争力的对数似然性能。此外,我们发现学习逆向扩散过程中的方差,可在几乎不损失样本质量的前提下,将前向传播次数减少一个数量级,这对模型的实际部署具有重要意义。我们还引入精确率(precision)与召回率(recall)来评估DDPM与生成对抗网络(GANs)在覆盖目标分布方面的表现。最后,我们表明,此类模型的样本质量与对数似然性能能够随着模型容量和训练计算资源的增加而平滑提升,展现出良好的可扩展性。相关代码已开源,地址为:https://github.com/openai/improved-diffusion。
代码仓库
neonbjb/tortoise-tts
pytorch
GitHub 中提及
rowerliu/add
pytorch
GitHub 中提及
g4vrel/DDPM
pytorch
GitHub 中提及
intuitive-robots/beso
pytorch
GitHub 中提及
astrodeepnet/diffusion4astro
pytorch
GitHub 中提及
roselv/research_super-resolution
pytorch
GitHub 中提及
Michedev/DDPM-Pytorch
pytorch
vvvm23/ddpm
pytorch
GitHub 中提及
liaopeiyuan/pndm
pytorch
GitHub 中提及
luping-liu/PNDM
pytorch
GitHub 中提及
openai/improved-diffusion
官方
pytorch
GitHub 中提及
Ipsedo/MusicDiffusion
pytorch
GitHub 中提及
rowerliu/adbd
pytorch
GitHub 中提及
albarji/toy-diffusion
pytorch
GitHub 中提及
plai-group/flexible-video-diffusion-modeling
pytorch
GitHub 中提及
YHL04/ddpm
pytorch
open-mmlab/mmgeneration
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-imagenet-256x256 | Improved DDPM | FID: 12.3 |
| image-generation-on-imagenet-64x64 | Improved DDPM | Bits per dim: 3.53 FID: 2.92 |