Sicheng GaoXuhui LiuBohan ZengSheng XuYanjing LiXiaoyan LuoJianzhuang LiuXiantong ZhenBaochang Zhang

摘要
图像超分辨率(Image Super-Resolution, SR)因其广泛的应用前景而受到越来越多的关注。然而,现有的SR方法普遍面临过度平滑和伪影等问题,且多数方法仅支持固定的放大倍数。本文提出一种隐式扩散模型(Implicit Diffusion Model, IDM),用于实现高保真度的连续图像超分辨率。IDM在统一的端到端框架中融合了隐式神经表示(Implicit Neural Representation)与去噪扩散模型(Denoising Diffusion Model),其中隐式神经表示被引入解码过程,以学习连续分辨率下的图像表示。此外,本文设计了一种可调控尺度的条件机制,该机制由低分辨率(Low-Resolution, LR)条件网络与缩放因子组成。缩放因子用于调节输出分辨率,并相应地调控低分辨率信息与生成特征在最终输出中的比例,从而实现对连续分辨率需求的灵活适配。大量实验验证了所提IDM的有效性,并表明其在性能上显著优于现有方法。
代码仓库
ree1s/idm
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-super-resolution-on-celeba-hq-128x128 | IDM | PSNR: 24.01 SSIM: 0.71 |
| image-super-resolution-on-celeba-hq-128x128 | SR3 | PSNR: 23.04 SSIM: 0.65 |
| image-super-resolution-on-div2k-val-4x | RankSRGAN | PSNR: 26.55 SSIM: 0.75 |
| image-super-resolution-on-div2k-val-4x | LAR-SR | PSNR: 27.03 SSIM: 0.77 |
| image-super-resolution-on-div2k-val-4x | Bicubic | PSNR: 26.7 SSIM: 0.77 |
| image-super-resolution-on-div2k-val-4x | HCFlow | PSNR: 27.02 SSIM: 0.76 |
| image-super-resolution-on-div2k-val-4x | HCFlow++ | PSNR: 26.61 SSIM: 0.74 |
| image-super-resolution-on-div2k-val-4x | ESRGAN | PSNR: 26.22 SSIM: 0.75 |
| image-super-resolution-on-div2k-val-4x | IDM | PSNR: 27.59 SSIM: 0.78 |