
摘要
近年来,开发在训练过程中对异常值具有鲁棒性的图像生成模型,引起了研究社区的广泛关注。由于不平衡最优传输(Unbalanced Optimal Transport, UOT)易于融入对抗性框架,现有工作主要聚焦于构建针对生成对抗网络(Generative Adversarial Networks, GAN)的鲁棒性框架。然而,近年来扩散模型(Diffusion Models)已在多种任务和数据集上超越了GAN,展现出强大的性能。但据我们所知,现有扩散模型均缺乏对受损数据集的鲁棒性。受DDGAN的启发,本文首次提出一种对异常值具有鲁棒性的扩散模型。我们建议在DDGAN框架中,将原本基于UOT的GAN生成模型替换为用于学习逆向扩散过程的UOT驱动模型。此外,我们证明了所提出框架中散度函数的Lipschitz性质有助于实现更稳定的训练收敛。值得注意的是,我们的方法不仅在受损数据集上表现出显著的鲁棒性,同时在干净数据集上也取得了优于现有方法的性能表现。
代码仓库
VinAIResearch/RDUOT
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-celeba-hq-256x256 | RDUOT | FID: 5.6 Recall: 0.38 |
| image-generation-on-cifar-10 | RDUOT | FID: 2.95 |
| image-generation-on-stl-10 | RDUOT | FID: 11.5 Recall: 0.49 |
| image-generation-on-stl-10 | RDGAN | FID: 13.07 Recall: 0.47 |