3 个月前

基于内部GAN的盲超分辨率核估计

基于内部GAN的盲超分辨率核估计

摘要

超分辨率(Super Resolution, SR)方法通常假设低分辨率(Low-Resolution, LR)图像由未知的高分辨率(High-Resolution, HR)图像通过一个固定的“理想”下采样核(如双三次下采样)生成。然而,在真实场景中的LR图像中,这一假设往往并不成立,与人工合成的SR数据集形成鲜明对比。当所假设的下采样核与真实情况存在偏差时,SR方法的性能将显著下降。这一问题催生了盲超分辨率(Blind-SR)——即在下采样核(“SR核”)未知的情况下进行超分辨率重建。已有研究表明,真实的SR核是能够最大化LR图像在不同尺度间图像块(patches)重复性的那个核。本文提出,可通过深度内部学习(Deep Internal Learning)实现这一强大的跨尺度重复性特性。为此,我们提出了“KernelGAN”——一种仅依赖于测试阶段输入的LR图像、无需外部训练数据的图像自适应内部生成对抗网络(Internal-GAN)。KernelGAN在测试时仅基于待处理的LR图像进行训练,学习其内部图像块的分布特征。其生成器(Generator)被训练以生成一个下采样版本的LR图像,使得判别器(Discriminator)无法区分该下采样图像的图像块分布与原始LR图像的图像块分布之间的差异。训练完成后,生成器即构成了具有正确图像特定SR核的下采样操作。KernelGAN完全无监督,仅需输入图像本身作为唯一数据源,无需额外训练数据。当将其集成至现有的SR算法中时,可显著提升盲超分辨率的性能,达到当前最先进的水平。

代码仓库

RomanovIgnat/KernelGAN
pytorch
GitHub 中提及
sefibk/KernelGAN
官方
pytorch
GitHub 中提及
BillOuyang/KernelGan-s3
pytorch
GitHub 中提及
Lornatang/KernelGAN
pytorch
GitHub 中提及

基准测试

基准方法指标
blind-super-resolution-on-div2krk-2xKernelGAN+ZSSR
PSNR: 30.36
SSIM: 0.8669

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于内部GAN的盲超分辨率核估计 | 论文 | HyperAI超神经