3 个月前

扩散ODEs的最大似然估计的改进技术

扩散ODEs的最大似然估计的改进技术

摘要

扩散模型在多个领域展现出卓越的性能。扩散模型的概率流常微分方程(Diffusion ODE)是连续归一化流(Continuous Normalizing Flows, CNFs)的一个特例,能够实现确定性推理与精确的似然值评估。然而,当前基于扩散ODE的似然估计性能仍远落后于最先进的基于似然的生成模型。在本工作中,我们提出了一系列针对扩散ODE最大似然估计的改进技术,涵盖训练与评估两个方面。在训练阶段,我们提出了速度参数化方法,并探索了方差缩减技术,以加速模型收敛。此外,我们推导出一种误差有界高阶流匹配目标,用于微调阶段,该目标不仅提升了ODE的似然值,还使轨迹更加平滑。在评估阶段,我们提出了一种新颖的无需训练的截断正态去量化方法,有效弥合了扩散ODE在训练与评估之间普遍存在的差距。基于上述技术,我们在图像数据集上取得了当前最优的似然估计性能:在CIFAR-10上达到2.56的似然分数(无需变分去量化或数据增强),在ImageNet-32上分别达到3.43和3.69;若使用数据增强,则CIFAR-10上的似然分数进一步提升至2.42。相关代码已开源,地址为:\url{https://github.com/thu-ml/i-DODE}。

代码仓库

thu-ml/i-dode
官方
jax
GitHub 中提及

基准测试

基准方法指标
density-estimation-on-cifar-10i-DODE
NLL (bits/dim): 2.42
density-estimation-on-imagenet-32x32-1i-DODE
NLL (bits/dim): 3.69
image-generation-on-imagenet-32x32i-DODE
FID: 9.09
bpd: 3.43

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
扩散ODEs的最大似然估计的改进技术 | 论文 | HyperAI超神经