3 个月前

去噪扩散概率模型

去噪扩散概率模型

摘要

我们展示了利用扩散概率模型(diffusion probabilistic models)生成高质量图像的结果。这类模型属于潜在变量模型,其设计灵感来源于非平衡热力学的理论思考。通过基于扩散概率模型与基于Langevin动力学的去噪得分匹配之间新发现的联系,构建并训练了一个加权变分界(weighted variational bound),从而获得了最优性能。我们的模型自然地支持一种渐进式的有损解压缩机制,该机制可被理解为自回归解码过程的一种推广。在无条件的CIFAR10数据集上,我们取得了9.46的Inception分数和3.17的当前最优FID分数;在256×256分辨率的LSUN数据集上,生成样本的质量与ProgressiveGAN相当。相关代码实现已开源,地址为:https://github.com/hojonathanho/diffusion。

代码仓库

dopplerchase/cira-diff
pytorch
GitHub 中提及
lucidrains/ddpm-proteins
pytorch
GitHub 中提及
lmnt-com/wavegrad
pytorch
GitHub 中提及
xiaoiker/meta_dpm
pytorch
GitHub 中提及
hojonathanho/diffusion
官方
tf
GitHub 中提及
vainf/diff-pruning
jax
GitHub 中提及
sillsill777/Diffusion
pytorch
GitHub 中提及
w86763777/pytorch-ddpm
pytorch
GitHub 中提及
devjake/eeg-diffusion-pytorch
pytorch
GitHub 中提及
hankpipi/diffusers-hetu
jax
GitHub 中提及
jeremyiv/diffc
pytorch
GitHub 中提及
g4vrel/DDPM
pytorch
GitHub 中提及
neillu23/DiffuSE
pytorch
GitHub 中提及
maum-ai/wavegrad2
pytorch
GitHub 中提及
maxjcohen/diffusion-bridges
pytorch
GitHub 中提及
joh-fischer/PlantLDM
pytorch
GitHub 中提及
vvvm23/ddpm
pytorch
GitHub 中提及
bot66/mnistdiffusion
pytorch
GitHub 中提及
Ipsedo/MusicDiffusion
pytorch
GitHub 中提及
xiaosheng-zhao/st4diffusion
pytorch
GitHub 中提及
acids-ircam/diffusion_models
pytorch
GitHub 中提及
albarji/toy-diffusion
pytorch
GitHub 中提及
KiUngSong/Generative-Models
pytorch
GitHub 中提及
neillu23/cdiffuse
pytorch
GitHub 中提及
samb-t/unleashing-transformers
pytorch
GitHub 中提及
Ashwin-Pokharel/base_diffusion
pytorch
GitHub 中提及
yang-song/score_sde
pytorch
GitHub 中提及
kpandey008/DiffuseVAE
jax
GitHub 中提及
glouppe/info8010-deep-learning
pytorch
GitHub 中提及
ivanvovk/WaveGrad
pytorch
GitHub 中提及
tiwarylab/DDPM_REMD
pytorch
GitHub 中提及
CW-Huang/sdeflow-light
pytorch
GitHub 中提及
lmnt-com/diffwave
pytorch
GitHub 中提及
lucidrains/imagen-pytorch
pytorch
GitHub 中提及
tqch/ddpm-torch
pytorch
GitHub 中提及
rapisurazurite/camodiffusion
pytorch
GitHub 中提及
YHL04/ddpm
pytorch
tcl9876/denoising_synthesis
tf
GitHub 中提及
SinclairHudson/RePaint
pytorch
GitHub 中提及
yang-song/score_sde_pytorch
pytorch
GitHub 中提及
mindslab-ai/wavegrad2
pytorch
GitHub 中提及
crowsonkb/v-diffusion-jax
jax
GitHub 中提及
explainingai-code/DDPM-Pytorch
pytorch
GitHub 中提及
tcapelle/Diffusion-Models-pytorch
pytorch
GitHub 中提及
teticio/audio-diffusion
pytorch
GitHub 中提及
lucidrains/make-a-video-pytorch
pytorch
GitHub 中提及
keonlee9420/DiffGAN-TTS
pytorch
GitHub 中提及

基准测试

基准方法指标
density-estimation-on-cifar-10DDPM
NLL (bits/dim): 3.69
image-generation-on-cifar-10Denoising Diffusion
FID: 3.17
image-generation-on-imagenet-32x32DDPM
FID: 16.18
bpd: 3.89
image-generation-on-lsun-bedroom-1Denoising Diffusion Probabilistic Model
FID-50k: 4.9
image-generation-on-lsun-bedroom-256-x-256Denoising Diffusion Probabilistic Model (large)
FID: 4.9
image-generation-on-lsun-bedroom-256-x-256Denoising Diffusion Probabilistic Model (large, DINOv2)
FD: 229.76
Precision: 0.79
Recall: 0.61
image-generation-on-lsun-bedroom-256-x-256Denoising Diffusion Probabilistic Model
FID: 6.36
image-generation-on-lsun-cat-256-x-256Denoising Diffusion Probabilistic Model
FID: 19.75
image-generation-on-lsun-churches-256-x-256Denoising Diffusion Probabilistic Model
FID: 7.89

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
去噪扩散概率模型 | 论文 | HyperAI超神经