
摘要
我们展示了利用扩散概率模型(diffusion probabilistic models)生成高质量图像的结果。这类模型属于潜在变量模型,其设计灵感来源于非平衡热力学的理论思考。通过基于扩散概率模型与基于Langevin动力学的去噪得分匹配之间新发现的联系,构建并训练了一个加权变分界(weighted variational bound),从而获得了最优性能。我们的模型自然地支持一种渐进式的有损解压缩机制,该机制可被理解为自回归解码过程的一种推广。在无条件的CIFAR10数据集上,我们取得了9.46的Inception分数和3.17的当前最优FID分数;在256×256分辨率的LSUN数据集上,生成样本的质量与ProgressiveGAN相当。相关代码实现已开源,地址为:https://github.com/hojonathanho/diffusion。
代码仓库
sak-h/pytorch-Denoising-Diffusion-Probabilistic-Models
pytorch
GitHub 中提及
dopplerchase/cira-diff
pytorch
GitHub 中提及
lucidrains/ddpm-proteins
pytorch
GitHub 中提及
lmnt-com/wavegrad
pytorch
GitHub 中提及
xiaoiker/meta_dpm
pytorch
GitHub 中提及
andreasfloros/diffusion
pytorch
ml-postech/robust-evaluation-of-diffusion-based-purification
pytorch
GitHub 中提及
lvyufeng/denoising-diffusion-mindspore
mindspore
GitHub 中提及
hojonathanho/diffusion
官方
tf
GitHub 中提及
vainf/diff-pruning
jax
GitHub 中提及
sillsill777/Diffusion
pytorch
GitHub 中提及
w86763777/pytorch-ddpm
pytorch
GitHub 中提及
devjake/eeg-diffusion-pytorch
pytorch
GitHub 中提及
hankpipi/diffusers-hetu
jax
GitHub 中提及
jeremyiv/diffc
pytorch
GitHub 中提及
arpitbansal297/cold-diffusion-models
pytorch
GitHub 中提及
g4vrel/DDPM
pytorch
GitHub 中提及
neillu23/DiffuSE
pytorch
GitHub 中提及
maum-ai/wavegrad2
pytorch
GitHub 中提及
BrianPulfer/PapersReimplementations
pytorch
GitHub 中提及
maxjcohen/diffusion-bridges
pytorch
GitHub 中提及
joh-fischer/PlantLDM
pytorch
GitHub 中提及
Michedev/DDPM-Pytorch
pytorch
vvvm23/ddpm
pytorch
GitHub 中提及
bot66/mnistdiffusion
pytorch
GitHub 中提及
beresandras/clear-diffusion-keras
tf
GitHub 中提及
Ipsedo/MusicDiffusion
pytorch
GitHub 中提及
xiaosheng-zhao/st4diffusion
pytorch
GitHub 中提及
keonlee9420/DiffSinger
pytorch
acids-ircam/diffusion_models
pytorch
GitHub 中提及
quental96/learnopencv-ddpm
pytorch
yiyixuxu/denoising-diffusion-flax
jax
GitHub 中提及
albarji/toy-diffusion
pytorch
GitHub 中提及
KiUngSong/Generative-Models
pytorch
GitHub 中提及
lucidrains/denoising-diffusion-pytorch
pytorch
GitHub 中提及
neillu23/cdiffuse
pytorch
GitHub 中提及
samb-t/unleashing-transformers
pytorch
GitHub 中提及
Ashwin-Pokharel/base_diffusion
pytorch
GitHub 中提及
Janspiry/Palette-Image-to-Image-Diffusion-Models
pytorch
GitHub 中提及
yang-song/score_sde
pytorch
GitHub 中提及
kpandey008/DiffuseVAE
jax
GitHub 中提及
glouppe/info8010-deep-learning
pytorch
GitHub 中提及
teapearce/conditional_diffusion_mnist
pytorch
GitHub 中提及
cjfghk5697/Pytorch-Research-Paper-Implementations
pytorch
GitHub 中提及
ivanvovk/WaveGrad
pytorch
GitHub 中提及
tiwarylab/DDPM_REMD
pytorch
GitHub 中提及
CW-Huang/sdeflow-light
pytorch
GitHub 中提及
lmnt-com/diffwave
pytorch
GitHub 中提及
henryaddison/score_sde_pytorch
jax
GitHub 中提及
lucidrains/imagen-pytorch
pytorch
GitHub 中提及
tqch/ddpm-torch
pytorch
GitHub 中提及
rapisurazurite/camodiffusion
pytorch
GitHub 中提及
YHL04/ddpm
pytorch
tcl9876/denoising_synthesis
tf
GitHub 中提及
SinclairHudson/RePaint
pytorch
GitHub 中提及
yang-song/score_sde_pytorch
pytorch
GitHub 中提及
mindslab-ai/wavegrad2
pytorch
GitHub 中提及
crowsonkb/v-diffusion-jax
jax
GitHub 中提及
explainingai-code/DDPM-Pytorch
pytorch
GitHub 中提及
tcapelle/Diffusion-Models-pytorch
pytorch
GitHub 中提及
teticio/audio-diffusion
pytorch
GitHub 中提及
lucidrains/make-a-video-pytorch
pytorch
GitHub 中提及
mszpc/denoising-diffusion-mindspore
mindspore
keonlee9420/DiffGAN-TTS
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| density-estimation-on-cifar-10 | DDPM | NLL (bits/dim): 3.69 |
| image-generation-on-cifar-10 | Denoising Diffusion | FID: 3.17 |
| image-generation-on-imagenet-32x32 | DDPM | FID: 16.18 bpd: 3.89 |
| image-generation-on-lsun-bedroom-1 | Denoising Diffusion Probabilistic Model | FID-50k: 4.9 |
| image-generation-on-lsun-bedroom-256-x-256 | Denoising Diffusion Probabilistic Model (large) | FID: 4.9 |
| image-generation-on-lsun-bedroom-256-x-256 | Denoising Diffusion Probabilistic Model (large, DINOv2) | FD: 229.76 Precision: 0.79 Recall: 0.61 |
| image-generation-on-lsun-bedroom-256-x-256 | Denoising Diffusion Probabilistic Model | FID: 6.36 |
| image-generation-on-lsun-cat-256-x-256 | Denoising Diffusion Probabilistic Model | FID: 19.75 |
| image-generation-on-lsun-churches-256-x-256 | Denoising Diffusion Probabilistic Model | FID: 7.89 |