6 个月前

摘要

模糊图像在频域中被自然地分析，方法是基于模糊图像估计出潜在的清晰图像与模糊核。近年来，图像去模糊研究普遍采用端到端的网络架构，旨在从像素级层面学习模糊图像与清晰图像之间的差异，但这一做法不可避免地忽略了模糊核的重要性。本文揭示了一个引人注目的现象：仅对模糊图像的频域进行ReLU操作，再通过逆傅里叶变换恢复，即所谓的“频域选择”操作，即可获得关于模糊模式的忠实信息（例如模糊方向、模糊程度，隐式地反映了模糊核的结构特征）。基于这一发现，我们提出在标准ResBlock中引入傅里叶变换、ReLU操作与逆傅里叶变换，以引入核级信息，用于图像去模糊网络。此外，进一步加入1×1卷积，使网络能够灵活调节频域选择的阈值。我们所构建的新模块称为Res FFT-ReLU Block，该模块通过学习频域-空域双域表示，有效融合了核级与像素级特征。我们进行了大量实验，对所提方法的内在机理进行了深入分析。此外，将该模块嵌入NAFNet后，我们在GoPro数据集上实现了33.85 dB的PSNR性能。该方法在不显著增加参数量的前提下，显著提升了骨干网络的性能，同时保持了较低的计算复杂度。代码已开源，地址为：https://github.com/DeepMed-Lab/DeepRFT-AAAI2023。

源 PDF