
摘要
我们提出了一种名为极性采样(Polarity Sampling)的理论严谨、即插即用的方法,用于控制预训练深度生成网络(Deep Generative Networks, DGNs)的生成质量与多样性。基于DGNs本质上可视为连续分段仿射样条(continuous piecewise affine splines),或可被其良好近似这一事实,我们推导出DGN输出空间分布的解析表达式,该表达式为DGN雅可比行列式奇异值乘积的幂函数,其指数为参数 $ρ$。我们称该参数 $ρ$ 为极性(polarity)参数,并证明:当 $ρ < 0$ 时,采样聚焦于输出空间分布的模式(modes);当 $ρ > 0$ 时,则聚焦于反模式(anti-modes)。实验表明,相较于传统方法(如截断采样,truncation),引入非零极性参数可在多个前沿DGN模型上实现更优的精度-召回率(质量-多样性)帕累托前沿。我们进一步提供了大量定性和定量结果,验证了在多种条件与非条件图像生成任务中,该方法显著提升了整体生成质量,例如在Fréchet inception距离(FID)指标上取得显著改善。所测试的模型包括StyleGAN3、BigGAN-deep和NVAE等当前最先进的生成网络。特别地,极性采样重新定义了多个基准任务上的性能上限:在FFHQ数据集上,StyleGAN2的FID降至2.57;在LSUN Car数据集上,StyleGAN2的FID降至2.27;在AFHQv2数据集上,StyleGAN3的FID降至3.95。演示视频与代码:bit.ly/polarity-samp
代码仓库
AhmedImtiazPrio/magnet-polarity
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-afhqv2 | Polarity-StyleGAN3 | FID: 3.95 |
| image-generation-on-celeba-hq-1024x1024 | Polarity-ProGAN | FID: 7.28 |
| image-generation-on-ffhq-1024-x-1024 | Polarity-StyleGAN2 | FID: 2.57 |
| image-generation-on-imagenet-256x256 | Polarity-BigGAN | FID: 6.82 |
| image-generation-on-lsun-car-512-x-384 | Polarity-StyleGAN2 | FID: 2.27 |
| image-generation-on-lsun-cat-256-x-256 | Polarity-StyleGAN2 | FID: 6.34 |
| image-generation-on-lsun-churches-256-x-256 | Polarity-StyleGAN2 | FID: 3.92 |