3 个月前

图像去模糊中频率选择的引人注目发现

图像去模糊中频率选择的引人注目发现

摘要

模糊图像在频域中被自然地分析,方法是基于模糊图像估计出潜在的清晰图像与模糊核。近年来,图像去模糊研究普遍采用端到端的网络架构,旨在从像素级层面学习模糊图像与清晰图像之间的差异,但这一做法不可避免地忽略了模糊核的重要性。本文揭示了一个引人注目的现象:仅对模糊图像的频域进行ReLU操作,再通过逆傅里叶变换恢复,即所谓的“频域选择”操作,即可获得关于模糊模式的忠实信息(例如模糊方向、模糊程度,隐式地反映了模糊核的结构特征)。基于这一发现,我们提出在标准ResBlock中引入傅里叶变换、ReLU操作与逆傅里叶变换,以引入核级信息,用于图像去模糊网络。此外,进一步加入1×1卷积,使网络能够灵活调节频域选择的阈值。我们所构建的新模块称为Res FFT-ReLU Block,该模块通过学习频域-空域双域表示,有效融合了核级与像素级特征。我们进行了大量实验,对所提方法的内在机理进行了深入分析。此外,将该模块嵌入NAFNet后,我们在GoPro数据集上实现了33.85 dB的PSNR性能。该方法在不显著增加参数量的前提下,显著提升了骨干网络的性能,同时保持了较低的计算复杂度。代码已开源,地址为:https://github.com/DeepMed-Lab/DeepRFT-AAAI2023。

代码仓库

INVOKERer/AdaRevD
pytorch
GitHub 中提及
INVOKERer/LoFormer
pytorch
GitHub 中提及
deepmed-lab/deeprft-aaai2023
官方
pytorch
GitHub 中提及
invokerer/deeprft
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
deblurring-on-basedDeeprft (GoPro)
ERQAv2.0: 0.74323
LPIPS: 0.08326
PSNR: 31.57612
SSIM: 0.94484
Subjective: 0.5354
VMAF: 66.55057
deblurring-on-basedDeeprft (REDS)
ERQAv2.0: 0.74339
LPIPS: 0.08139
PSNR: 31.32349
SSIM: 0.94479
Subjective: 0.4622
VMAF: 66.46811
deblurring-on-goproDeepRFT+
PSNR: 33.52
SSIM: 0.965
deblurring-on-hide-trained-on-goproDeepRFT+
PSNR (sRGB): 31.66
SSIM (sRGB): 0.946
deblurring-on-realblur-j-1DeepRFT+
PSNR (sRGB): 32.63
SSIM (sRGB): 0.933
deblurring-on-realblur-j-trained-on-goproDeepRFT+
PSNR (sRGB): 28.88
SSIM (sRGB): 0.880
deblurring-on-realblur-rDeepRFT+
PSNR (sRGB): 40.01
SSIM (sRGB): 0.973
deblurring-on-realblur-r-trained-on-goproDeepRFT
PSNR (sRGB): 36.11
SSIM (sRGB): 0.955
image-deblurring-on-goproDeepRFT+
PSNR: 33.52
SSIM: 0.965

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
图像去模糊中频率选择的引人注目发现 | 论文 | HyperAI超神经