
摘要
自编码器网络是一类无监督学习方法,旨在通过同时学习编码器-生成器映射,融合生成能力与表征学习特性。尽管该领域已得到广泛研究,但其生成能力是否与生成对抗网络(GAN)相当,以及能否学习到解耦表征等问题,仍未得到充分解答。为此,我们提出一种能够联合解决上述问题的自编码器架构,称为对抗潜在自编码器(Adversarial Latent Autoencoder, ALAE)。该架构具有通用性,可有效利用近年来在GAN训练技术方面的进展。我们设计了两种自编码器结构:一种基于多层感知机(MLP)编码器,另一种则基于StyleGAN生成器,后者被称为StyleALAE。我们验证了两种架构在表征解耦性方面的表现。实验表明,StyleALAE不仅能够生成与StyleGAN相当质量的1024×1024人脸图像,还能在相同分辨率下实现基于真实图像的面部重建与编辑操作。这使得ALAE成为首个在性能上可与仅含生成器的架构相媲美,甚至超越其能力的自编码器模型。
代码仓库
revsic/tf-alae
tf
GitHub 中提及
PaYo90/Copy-of-ALAE
pytorch
GitHub 中提及
krantirk/-Adversarial-Latent-Autoencoders
pytorch
GitHub 中提及
ariel415el/SimplePytorch-ALAE
pytorch
GitHub 中提及
frederictost/alae_tf2
tf
GitHub 中提及
cant12/MammoGan
pytorch
GitHub 中提及
shockyou1988/ALAE
pytorch
GitHub 中提及
ElliottKasoar/gene-dag-vae
tf
GitHub 中提及
ElliottKasoar/GeneVAE
tf
GitHub 中提及
podgorskiy/ALAE
官方
pytorch
GitHub 中提及
taldatech/soft-intro-vae-pytorch
pytorch
GitHub 中提及
changwoo-00/Adversarial_Latent_Autoencoders
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-celeba-256x256 | StyleALAE | FID: 19.21 |
| image-generation-on-ffhq-1024-x-1024 | StyleALAE | FID: 13.09 |