
摘要
模糊图像在频域中被自然地分析,方法是基于模糊图像估计出潜在的清晰图像与模糊核。近年来,图像去模糊研究普遍采用端到端的网络架构,旨在从像素级层面学习模糊图像与清晰图像之间的差异,但这一做法不可避免地忽略了模糊核的重要性。本文揭示了一个引人注目的现象:仅对模糊图像的频域进行ReLU操作,再通过逆傅里叶变换恢复,即所谓的“频域选择”操作,即可获得关于模糊模式的忠实信息(例如模糊方向、模糊程度,隐式地反映了模糊核的结构特征)。基于这一发现,我们提出在标准ResBlock中引入傅里叶变换、ReLU操作与逆傅里叶变换,以引入核级信息,用于图像去模糊网络。此外,进一步加入1×1卷积,使网络能够灵活调节频域选择的阈值。我们所构建的新模块称为Res FFT-ReLU Block,该模块通过学习频域-空域双域表示,有效融合了核级与像素级特征。我们进行了大量实验,对所提方法的内在机理进行了深入分析。此外,将该模块嵌入NAFNet后,我们在GoPro数据集上实现了33.85 dB的PSNR性能。该方法在不显著增加参数量的前提下,显著提升了骨干网络的性能,同时保持了较低的计算复杂度。代码已开源,地址为:https://github.com/DeepMed-Lab/DeepRFT-AAAI2023。
代码仓库
INVOKERer/AdaRevD
pytorch
GitHub 中提及
deepmed-lab-ecnu/single-image-deblur
pytorch
GitHub 中提及
INVOKERer/LoFormer
pytorch
GitHub 中提及
deepmed-lab/deeprft-aaai2023
官方
pytorch
GitHub 中提及
invokerer/deeprft
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| deblurring-on-based | Deeprft (GoPro) | ERQAv2.0: 0.74323 LPIPS: 0.08326 PSNR: 31.57612 SSIM: 0.94484 Subjective: 0.5354 VMAF: 66.55057 |
| deblurring-on-based | Deeprft (REDS) | ERQAv2.0: 0.74339 LPIPS: 0.08139 PSNR: 31.32349 SSIM: 0.94479 Subjective: 0.4622 VMAF: 66.46811 |
| deblurring-on-gopro | DeepRFT+ | PSNR: 33.52 SSIM: 0.965 |
| deblurring-on-hide-trained-on-gopro | DeepRFT+ | PSNR (sRGB): 31.66 SSIM (sRGB): 0.946 |
| deblurring-on-realblur-j-1 | DeepRFT+ | PSNR (sRGB): 32.63 SSIM (sRGB): 0.933 |
| deblurring-on-realblur-j-trained-on-gopro | DeepRFT+ | PSNR (sRGB): 28.88 SSIM (sRGB): 0.880 |
| deblurring-on-realblur-r | DeepRFT+ | PSNR (sRGB): 40.01 SSIM (sRGB): 0.973 |
| deblurring-on-realblur-r-trained-on-gopro | DeepRFT | PSNR (sRGB): 36.11 SSIM (sRGB): 0.955 |
| image-deblurring-on-gopro | DeepRFT+ | PSNR: 33.52 SSIM: 0.965 |