4 个月前

通过重新审视全局信息聚合改进图像恢复

通过重新审视全局信息聚合改进图像恢复

摘要

全局操作,如全局平均池化,在高性能图像修复模型中被广泛使用。这些操作沿整个空间维度从输入特征中聚合全局信息,但在图像修复任务的训练和推理过程中表现不同:它们基于不同的区域,即训练时的裁剪块(来自图像)和推理时的全分辨率图像。本文重新审视了全局信息聚合,并发现推理过程中基于图像的特征分布与训练过程中基于裁剪块的特征分布存在差异。这种训练-测试不一致性对模型性能产生了负面影响,而以往的研究对此严重忽视。为了减少这种不一致性并提高测试时的性能,我们提出了一种简单的方法,称为测试时间局部转换器(Test-time Local Converter, TLC)。我们的TLC仅在推理阶段将全局操作转换为局部操作,从而使特征聚合在局部空间区域内进行,而不是在整个大图像上进行。所提出的TLC方法可以应用于各种全局模块(例如归一化、通道和空间注意力机制),且成本可忽略不计。无需任何微调,TLC在多个图像修复任务上提高了最先进的结果,包括单幅图像运动去模糊、视频去模糊、散焦去模糊和图像降噪。特别是,在GoPro数据集上,使用TLC后的Restormer-Local将单幅图像去模糊的最新结果从32.92 dB提升至33.57 dB。代码可在以下地址获取:https://github.com/megvii-research/tlc。

代码仓库

megvii-research/TLC
官方
pytorch
GitHub 中提及
megvii-research/NAFNet
pytorch
GitHub 中提及
setsunil/dsdnet
pytorch
GitHub 中提及

基准测试

基准方法指标
color-image-denoising-on-urban100-sigma30Restormer-Local
PSNR: 33.06
color-image-denoising-on-urban100-sigma50Restormer-Local
PSNR: 30.17
deblurring-on-basedMPR local
ERQAv2.0: 0.74521
LPIPS: 0.08323
PSNR: 31.65037
SSIM: 0.94542
Subjective: 0.4407
VMAF: 67.01788
deblurring-on-goproRestormer-Local
PSNR: 33.57
SSIM: 0.966
deblurring-on-goproHINet-local
PSNR: 33.08
SSIM: 0.962
deblurring-on-goproMPRNet-local
PSNR: 33.31
SSIM: 0.964
deblurring-on-goproRNN-MBP-Local
PSNR: 33.8
SSIM: 0.966
deblurring-on-hide-trained-on-goproMPRNet-TLC
PSNR (sRGB): 31.19
Params (M): 20.1
SSIM (sRGB): 0.942
deblurring-on-hide-trained-on-goproRestormer-TLC
PSNR (sRGB): 31.49
Params (M): 26.13
SSIM (sRGB): 0.945
grayscale-image-denoising-on-urban100-sigma15-1Restormer-Local
PSNR: 33.85
grayscale-image-denoising-on-urban100-sigma25Restormer-Local
PSNR: 31.55
grayscale-image-denoising-on-urban100-sigma50Restormer-Local
PSNR: 28.41
image-deblurring-on-goproHINet-TLC
PSNR: 33.08
SSIM: 0.962
image-deblurring-on-goproRestormer-TLC
PSNR: 33.57
Params (M): 26.13
SSIM: 0.966
image-deblurring-on-goproMPRNet-TLC
PSNR: 33.31
Params (M): 20.1
SSIM: 0.964

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过重新审视全局信息聚合改进图像恢复 | 论文 | HyperAI超神经