3 个月前

BIGRoC:通过鲁棒分类器提升图像生成

BIGRoC:通过鲁棒分类器提升图像生成

摘要

近年来,机器学习社区对图像生成的兴趣显著增长,这得益于大量深度生成模型及其训练方法的不断涌现。在本工作中,我们提出了一种通用的、与模型无关的图像质量提升方法,可有效改善任意生成模型所产出图像的视觉质量与分布保真度。我们的方法名为BIGRoC(通过鲁棒分类器提升图像生成,Boosting Image Generation via a Robust Classifier),其核心思想是利用一个给定的鲁棒分类器作为指导,通过后处理过程对生成图像进行优化,且无需对原始生成模型进行额外训练。具体而言,针对一张合成图像,我们提出通过在鲁棒分类器上执行投影梯度步进(projected gradient steps)来逐步优化其特征表示,从而提升其可识别性与视觉质量。我们在多种图像生成方法上验证了该后处理算法的有效性,并在CIFAR-10和ImageNet数据集上均取得了显著的定量与定性改进。令人惊讶的是,尽管BIGRoC是首个无需依赖特定生成模型结构的图像优化方法,且仅需极少的额外信息,其性能仍优于现有多种先进方法。具体而言,在ImageNet 128×128图像生成任务中,BIGRoC使当前表现最佳的扩散模型(diffusion model)的FID分数提升了14.81%,达到2.53;在256×256分辨率下,FID分数提升了7.87%,达到3.63。此外,我们还开展了人类偏好调查,结果显示,人类观察者显著更倾向于我们的方法生成的图像。

代码仓库

royg27/BIGRoC
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-generation-on-imagenet-128x128BIGRoC-pl (Guided-Diffusion)
FID: 2.77
IS: 150.43
image-generation-on-imagenet-128x128BIGRoC-gt (Guided-Diffusion)
FID: 2.53
IS: 169.73
image-generation-on-imagenet-256x256BIGRoC-pl (Guided-Diffusion)
FID: 3.69
image-generation-on-imagenet-256x256BIGRoC-gt (Guided-Diffusion)
FID: 3.63

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
BIGRoC:通过鲁棒分类器提升图像生成 | 论文 | HyperAI超神经