3 个月前

极性采样:通过奇异值控制预训练生成网络的质量与多样性

极性采样:通过奇异值控制预训练生成网络的质量与多样性

摘要

我们提出了一种名为极性采样(Polarity Sampling)的理论严谨、即插即用的方法,用于控制预训练深度生成网络(Deep Generative Networks, DGNs)的生成质量与多样性。基于DGNs本质上可视为连续分段仿射样条(continuous piecewise affine splines),或可被其良好近似这一事实,我们推导出DGN输出空间分布的解析表达式,该表达式为DGN雅可比行列式奇异值乘积的幂函数,其指数为参数 $ρ$。我们称该参数 $ρ$ 为极性(polarity)参数,并证明:当 $ρ < 0$ 时,采样聚焦于输出空间分布的模式(modes);当 $ρ > 0$ 时,则聚焦于反模式(anti-modes)。实验表明,相较于传统方法(如截断采样,truncation),引入非零极性参数可在多个前沿DGN模型上实现更优的精度-召回率(质量-多样性)帕累托前沿。我们进一步提供了大量定性和定量结果,验证了在多种条件与非条件图像生成任务中,该方法显著提升了整体生成质量,例如在Fréchet inception距离(FID)指标上取得显著改善。所测试的模型包括StyleGAN3、BigGAN-deep和NVAE等当前最先进的生成网络。特别地,极性采样重新定义了多个基准任务上的性能上限:在FFHQ数据集上,StyleGAN2的FID降至2.57;在LSUN Car数据集上,StyleGAN2的FID降至2.27;在AFHQv2数据集上,StyleGAN3的FID降至3.95。演示视频与代码:bit.ly/polarity-samp

代码仓库

AhmedImtiazPrio/magnet-polarity
官方
tf
GitHub 中提及

基准测试

基准方法指标
image-generation-on-afhqv2Polarity-StyleGAN3
FID: 3.95
image-generation-on-celeba-hq-1024x1024Polarity-ProGAN
FID: 7.28
image-generation-on-ffhq-1024-x-1024Polarity-StyleGAN2
FID: 2.57
image-generation-on-imagenet-256x256Polarity-BigGAN
FID: 6.82
image-generation-on-lsun-car-512-x-384Polarity-StyleGAN2
FID: 2.27
image-generation-on-lsun-cat-256-x-256Polarity-StyleGAN2
FID: 6.34
image-generation-on-lsun-churches-256-x-256Polarity-StyleGAN2
FID: 3.92

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
极性采样:通过奇异值控制预训练生成网络的质量与多样性 | 论文 | HyperAI超神经