3 个月前

LoFormer:用于图像去模糊的局部频率Transformer

LoFormer:用于图像去模糊的局部频率Transformer

摘要

由于自注意力机制(Self-Attention, SA)具有较高的计算复杂度,当前主流的图像去模糊方法通常采用局部化自注意力或粗粒度全局自注意力策略,但这两类方法均存在明显缺陷:前者削弱了全局建模能力,后者则难以捕捉细粒度的特征相关性。为有效建模长程依赖关系,同时不损失细节信息,本文提出一种新型架构——局部频率变换器(Local Frequency Transformer, LoFormer)。在LoFormer的每个模块中,我们引入了一种基于频域的局部通道自注意力机制(Frequency-domain Local Channel-wise Self-Attention, Freq-LC),用于在低频与高频局部窗口内同步捕捉跨通道协方差。该设计具有两大优势:(1)确保粗粒度结构与细粒度细节获得均衡的学习机会;(2)相比传统粗粒度全局自注意力方法,能够探索更丰富的表征特性。此外,我们还设计了一种与Freq-LC互补的MLP门控机制,用于抑制无关特征,同时增强模型的全局建模能力。实验结果表明,LoFormer在图像去模糊任务中显著提升了性能,在GoPro数据集上达到了34.09 dB的PSNR,仅需126G FLOPs。项目代码已开源:https://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur

代码仓库

deepmed-lab-ecnu/single-image-deblur
官方
pytorch
GitHub 中提及
INVOKERer/LoFormer
pytorch
GitHub 中提及

基准测试

基准方法指标
deblurring-on-hide-trained-on-goproLoFormer
PSNR (sRGB): 31.86
SSIM (sRGB): 0.949
deblurring-on-realblur-j-1LoFormer
PSNR (sRGB): 32.90
SSIM (sRGB): 0.933
deblurring-on-realblur-rLoFormer
PSNR (sRGB): 40.23
SSIM (sRGB): 0.974
image-deblurring-on-goproLoFormer
PSNR: 34.09
SSIM: 0.969

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
LoFormer:用于图像去模糊的局部频率Transformer | 论文 | HyperAI超神经