
摘要
我们介绍了二进制扩散概率模型(Binary Diffusion Probabilistic Model, BDPM),这是一种针对二进制数据表示进行优化的新生成模型。尽管去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPMs)在图像合成和恢复等任务中取得了显著成功,但传统的DDPM依赖于连续数据表示和均方误差(Mean Squared Error, MSE)损失进行训练,应用高斯噪声模型可能并不适用于离散或二进制数据结构。BDPM通过将图像分解为位平面并采用基于XOR的噪声变换来解决这一问题,其去噪模型使用二元交叉熵损失进行训练。这种方法实现了精确的噪声控制和计算高效的推理,显著降低了计算成本并提高了模型收敛速度。在图像超分辨率、修复和盲图像恢复等图像恢复任务上,BDPM在FFHQ、CelebA和CelebA-HQ数据集上的表现优于现有最先进方法。值得注意的是,BDPM达到最优结果所需的推理步骤少于传统DDPM模型,展示了其增强的推理效率。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| blind-face-restoration-on-celeba-test | BDPM | FID: 12.93 LPIPS: 29.3 PSNR: 24.58 SSIM: 0.742 |
| image-inpainting-on-celeba | BDPM | FID: 1.96 LPIPS: 0.08 PSNR: 28.3 SSIM: 0.928 |
| image-inpainting-on-celeba-hq | BDPM | FID: 1.17 P-IDS: 14.14 U-IDS: 28.4 |
| image-inpainting-on-ffhq-512-x-512 | BDPM | FID: 1.3 P-IDS: 17.43 U-IDS: 33.07 |
| image-super-resolution-on-celeba | BDPM | FID: 3.5 PSNR: 32.01 SSIM: 0.91 |
| image-super-resolution-on-ffhq-256-x-256-4x | BDPM | FID: 5.71 PSNR: 30.05 SSIM: 0.864 |