
摘要
从数据中生成噪声是容易的;而从噪声中生成数据,则构成了生成建模的核心。我们提出了一种随机微分方程(SDE),该方程通过逐步注入噪声,将复杂的原始数据分布平滑地转化为一个已知的先验分布;同时,我们还引入了一个反向时间SDE,通过逐步去除噪声,将先验分布重构回原始数据分布。关键在于,反向时间SDE仅依赖于扰动后数据分布的时间相关梯度场(即得分函数,score)。借助得分函数生成建模领域的最新进展,我们能够利用神经网络精确估计这些得分函数,并结合数值SDE求解器实现高效采样。我们证明,该框架统一了此前得分函数生成建模与扩散概率建模的多种方法,不仅支持新的采样流程,还拓展了模型的建模能力。特别地,我们提出了一种预测-校正(predictor-corrector)框架,用于修正离散化反向时间SDE演化过程中的累积误差。此外,我们推导出一个等价的神经微分方程(neural ODE),其采样分布与SDE完全一致,同时具备精确似然计算能力,并显著提升采样效率。此外,我们还提出了一种基于得分模型求解逆问题的新方法,并在条件类别生成、图像修复(inpainting)和图像着色等任务中进行了实验验证。结合多种架构改进,我们在CIFAR-10数据集上实现了无条件图像生成的全新纪录:Inception分数达到9.89,FID降至2.20,似然值达到2.99 bit/dim,且首次从得分函数生成模型中成功生成了分辨率为1024×1024的高质量图像,充分展现了模型在生成保真度与规模上的突破性进展。
代码仓库
X-LANCE/VoiceFlow-TTS
pytorch
GitHub 中提及
ermongroup/ncsnv2
pytorch
GitHub 中提及
ermongroup/ncsn
pytorch
GitHub 中提及
intuitive-robots/beso
pytorch
GitHub 中提及
luping-liu/PNDM
pytorch
GitHub 中提及
liaopeiyuan/pndm
pytorch
GitHub 中提及
yang-song/score_inverse_problems
jax
GitHub 中提及
yang-song/score_sde
官方
pytorch
g4vrel/sde_ddpm
pytorch
GitHub 中提及
CW-Huang/sdeflow-light
pytorch
GitHub 中提及
claserken/SISS
pytorch
GitHub 中提及
yang-song/score_sde_pytorch
pytorch
yanfeng-yang-0316/cdcit
pytorch
GitHub 中提及
hyn2028/tpdm
pytorch
GitHub 中提及
p-hss/consistency-climate-downscaling
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| density-estimation-on-cifar-10 | score SDE | NLL (bits/dim): 2.99 |