3 个月前

隐式扩散模型用于连续超分辨率

隐式扩散模型用于连续超分辨率

摘要

图像超分辨率(Image Super-Resolution, SR)因其广泛的应用前景而受到越来越多的关注。然而,现有的SR方法普遍面临过度平滑和伪影等问题,且多数方法仅支持固定的放大倍数。本文提出一种隐式扩散模型(Implicit Diffusion Model, IDM),用于实现高保真度的连续图像超分辨率。IDM在统一的端到端框架中融合了隐式神经表示(Implicit Neural Representation)与去噪扩散模型(Denoising Diffusion Model),其中隐式神经表示被引入解码过程,以学习连续分辨率下的图像表示。此外,本文设计了一种可调控尺度的条件机制,该机制由低分辨率(Low-Resolution, LR)条件网络与缩放因子组成。缩放因子用于调节输出分辨率,并相应地调控低分辨率信息与生成特征在最终输出中的比例,从而实现对连续分辨率需求的灵活适配。大量实验验证了所提IDM的有效性,并表明其在性能上显著优于现有方法。

代码仓库

ree1s/idm
官方
pytorch

基准测试

基准方法指标
image-super-resolution-on-celeba-hq-128x128IDM
PSNR: 24.01
SSIM: 0.71
image-super-resolution-on-celeba-hq-128x128SR3
PSNR: 23.04
SSIM: 0.65
image-super-resolution-on-div2k-val-4xRankSRGAN
PSNR: 26.55
SSIM: 0.75
image-super-resolution-on-div2k-val-4xLAR-SR
PSNR: 27.03
SSIM: 0.77
image-super-resolution-on-div2k-val-4xBicubic
PSNR: 26.7
SSIM: 0.77
image-super-resolution-on-div2k-val-4xHCFlow
PSNR: 27.02
SSIM: 0.76
image-super-resolution-on-div2k-val-4xHCFlow++
PSNR: 26.61
SSIM: 0.74
image-super-resolution-on-div2k-val-4xESRGAN
PSNR: 26.22
SSIM: 0.75
image-super-resolution-on-div2k-val-4xIDM
PSNR: 27.59
SSIM: 0.78

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
隐式扩散模型用于连续超分辨率 | 论文 | HyperAI超神经