
摘要
全局操作,如全局平均池化,在高性能图像修复模型中被广泛使用。这些操作沿整个空间维度从输入特征中聚合全局信息,但在图像修复任务的训练和推理过程中表现不同:它们基于不同的区域,即训练时的裁剪块(来自图像)和推理时的全分辨率图像。本文重新审视了全局信息聚合,并发现推理过程中基于图像的特征分布与训练过程中基于裁剪块的特征分布存在差异。这种训练-测试不一致性对模型性能产生了负面影响,而以往的研究对此严重忽视。为了减少这种不一致性并提高测试时的性能,我们提出了一种简单的方法,称为测试时间局部转换器(Test-time Local Converter, TLC)。我们的TLC仅在推理阶段将全局操作转换为局部操作,从而使特征聚合在局部空间区域内进行,而不是在整个大图像上进行。所提出的TLC方法可以应用于各种全局模块(例如归一化、通道和空间注意力机制),且成本可忽略不计。无需任何微调,TLC在多个图像修复任务上提高了最先进的结果,包括单幅图像运动去模糊、视频去模糊、散焦去模糊和图像降噪。特别是,在GoPro数据集上,使用TLC后的Restormer-Local将单幅图像去模糊的最新结果从32.92 dB提升至33.57 dB。代码可在以下地址获取:https://github.com/megvii-research/tlc。
代码仓库
megvii-research/TLC
官方
pytorch
GitHub 中提及
megvii-research/NAFNet
pytorch
GitHub 中提及
setsunil/dsdnet
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| color-image-denoising-on-urban100-sigma30 | Restormer-Local | PSNR: 33.06 |
| color-image-denoising-on-urban100-sigma50 | Restormer-Local | PSNR: 30.17 |
| deblurring-on-based | MPR local | ERQAv2.0: 0.74521 LPIPS: 0.08323 PSNR: 31.65037 SSIM: 0.94542 Subjective: 0.4407 VMAF: 67.01788 |
| deblurring-on-gopro | Restormer-Local | PSNR: 33.57 SSIM: 0.966 |
| deblurring-on-gopro | HINet-local | PSNR: 33.08 SSIM: 0.962 |
| deblurring-on-gopro | MPRNet-local | PSNR: 33.31 SSIM: 0.964 |
| deblurring-on-gopro | RNN-MBP-Local | PSNR: 33.8 SSIM: 0.966 |
| deblurring-on-hide-trained-on-gopro | MPRNet-TLC | PSNR (sRGB): 31.19 Params (M): 20.1 SSIM (sRGB): 0.942 |
| deblurring-on-hide-trained-on-gopro | Restormer-TLC | PSNR (sRGB): 31.49 Params (M): 26.13 SSIM (sRGB): 0.945 |
| grayscale-image-denoising-on-urban100-sigma15-1 | Restormer-Local | PSNR: 33.85 |
| grayscale-image-denoising-on-urban100-sigma25 | Restormer-Local | PSNR: 31.55 |
| grayscale-image-denoising-on-urban100-sigma50 | Restormer-Local | PSNR: 28.41 |
| image-deblurring-on-gopro | HINet-TLC | PSNR: 33.08 SSIM: 0.962 |
| image-deblurring-on-gopro | Restormer-TLC | PSNR: 33.57 Params (M): 26.13 SSIM: 0.966 |
| image-deblurring-on-gopro | MPRNet-TLC | PSNR: 33.31 Params (M): 20.1 SSIM: 0.964 |