4 个月前

二元扩散概率模型

二元扩散概率模型

摘要

我们介绍了二进制扩散概率模型(Binary Diffusion Probabilistic Model, BDPM),这是一种针对二进制数据表示进行优化的新生成模型。尽管去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPMs)在图像合成和恢复等任务中取得了显著成功,但传统的DDPM依赖于连续数据表示和均方误差(Mean Squared Error, MSE)损失进行训练,应用高斯噪声模型可能并不适用于离散或二进制数据结构。BDPM通过将图像分解为位平面并采用基于XOR的噪声变换来解决这一问题,其去噪模型使用二元交叉熵损失进行训练。这种方法实现了精确的噪声控制和计算高效的推理,显著降低了计算成本并提高了模型收敛速度。在图像超分辨率、修复和盲图像恢复等图像恢复任务上,BDPM在FFHQ、CelebA和CelebA-HQ数据集上的表现优于现有最先进方法。值得注意的是,BDPM达到最优结果所需的推理步骤少于传统DDPM模型,展示了其增强的推理效率。

基准测试

基准方法指标
blind-face-restoration-on-celeba-testBDPM
FID: 12.93
LPIPS: 29.3
PSNR: 24.58
SSIM: 0.742
image-inpainting-on-celebaBDPM
FID: 1.96
LPIPS: 0.08
PSNR: 28.3
SSIM: 0.928
image-inpainting-on-celeba-hqBDPM
FID: 1.17
P-IDS: 14.14
U-IDS: 28.4
image-inpainting-on-ffhq-512-x-512BDPM
FID: 1.3
P-IDS: 17.43
U-IDS: 33.07
image-super-resolution-on-celebaBDPM
FID: 3.5
PSNR: 32.01
SSIM: 0.91
image-super-resolution-on-ffhq-256-x-256-4xBDPM
FID: 5.71
PSNR: 30.05
SSIM: 0.864

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
二元扩散概率模型 | 论文 | HyperAI超神经