4 个月前

面向鲁棒的盲人脸修复与码本查找变压器

面向鲁棒的盲人脸修复与码本查找变压器

摘要

盲脸修复是一个高度不适定的问题,通常需要辅助指导来实现两个目标:1)改进从退化输入到期望输出的映射;2)补充输入中丢失的高质量细节。在本文中,我们展示了通过将盲脸修复转化为代码预测任务,可以在一个小的代理空间中利用学习到的离散码本先验(codebook prior),大幅减少修复映射中的不确定性和模糊性,同时为生成高质量人脸提供丰富的视觉原子。基于这一范式,我们提出了一种基于Transformer的预测网络,命名为CodeFormer,用于建模低质量人脸的全局组成和上下文以进行代码预测,即使输入严重退化也能发现与目标人脸接近的自然人脸。为了增强对不同退化情况的适应性,我们还提出了一种可控特征变换模块,允许在保真度和质量之间灵活权衡。得益于表达能力强的码本先验和全局建模,CodeFormer在质量和保真度方面均优于现有方法,并表现出对退化的优越鲁棒性。广泛的实验结果验证了我们的方法在合成数据集和真实世界数据集上的有效性。

代码仓库

sczhou/codeformer
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
blind-face-restoration-on-celeba-testCodeFormer
FID: 60.62
IDS: 60
LPIPS: 29.9
PSNR: 22.18
SSIM: 0.61
blind-face-restoration-on-lfwPULSE
FID: 64.86
blind-face-restoration-on-lfwGPEN
FID: 57.58
blind-face-restoration-on-lfwCodeFormer
FID: 52.02
blind-face-restoration-on-lfwPSFRGAN
FID: 51.89
blind-face-restoration-on-lfwGLEAN
FID: 53.49
blind-face-restoration-on-lfwDFDNet
FID: 62.57
blind-face-restoration-on-lfwGFP-GAN
FID: 49.96
blind-face-restoration-on-widerGLEAN
FID: 47.11
blind-face-restoration-on-widerPSFRGAN
FID: 51.16
blind-face-restoration-on-widerCodeFormer
FID: 39.06
blind-face-restoration-on-widerGPEN
FID: 46.99
blind-face-restoration-on-widerDFDNet
FID: 57.84
blind-face-restoration-on-widerPULSE
FID: 73.59
blind-face-restoration-on-widerGFP-GAN
FID: 40.59

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向鲁棒的盲人脸修复与码本查找变压器 | 论文 | HyperAI超神经