3 个月前

WavePaint:面向自监督图像修复的高效资源Token混合方法

WavePaint:面向自监督图像修复的高效资源Token混合方法

摘要

图像修复(image inpainting)是指对图像中缺失区域进行合成,以恢复被遮挡或退化的部分,同时也可作为自监督学习的前置任务。当前最先进的图像修复模型通常计算开销较大,其架构基于Transformer或CNN主干网络,并在对抗训练或扩散模型框架下进行训练。本文提出一种不同于视觉Transformer的计算高效型全卷积架构——WavePaint,其核心基于WaveMix结构。该模型利用二维离散小波变换(2D Discrete Wavelet Transform, DWT)实现空间域与多分辨率下的特征混合,并结合卷积层进行高效建模。实验结果表明,WavePaint在图像重建质量上超越了当前最先进的图像修复模型,同时参数量不足其一半,训练与推理时间也显著降低。值得注意的是,该模型在CelebA-HQ数据集上的表现甚至优于现有基于GAN的架构,且无需使用对抗性可训练判别器。本研究表明,那些基于自然图像先验设计的神经网络架构,能够在显著减少参数量与计算成本的前提下,实现与Transformer相当的泛化能力。

代码仓库

pranavphoenix/WavePaint
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-inpainting-on-celeba-hqWavePaint
FID: 5.53
image-inpainting-on-imagenetWavePaint
FID: 3.21

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
WavePaint:面向自监督图像修复的高效资源Token混合方法 | 论文 | HyperAI超神经