
摘要
主成分分析(Principal Component Analysis, PCA)在固定分量维度的线性模型类中,最小化重构误差。概率主成分分析(Probabilistic PCA)通过学习PCA隐空间权重的概率分布,引入了概率结构,从而构建出一个生成模型。自编码器(Autoencoder, AE)则在固定隐空间维度的非线性模型类中最小化重构误差,在相同维度下表现优于PCA。本文提出一种概率自编码器(Probabilistic Autoencoder, PAE),其利用归一化流(Normalizing Flow, NF)学习自编码器隐空间权重的概率分布。PAE训练快速简便,能够实现较低的重构误差、高质量的样本生成,并在下游任务中表现出色。我们将PAE与变分自编码器(Variational Autoencoder, VAE)进行对比,结果表明:PAE训练速度更快,能达到更低的重构误差,且在无需特殊超参数调优或复杂训练流程的情况下,仍能生成高质量样本。进一步实验表明,PAE在贝叶斯推断框架下,对于图像修复(inpainting)和去噪(denoising)等逆问题的 probabilistic image reconstruction 任务中,具有强大的建模能力。最后,我们发现由归一化流所建模的隐空间密度,是一种极具潜力的异常检测指标。
代码仓库
chrvt/denoising-normalizing-flow
pytorch
GitHub 中提及
VMBoehm/PAE
官方
tf
GitHub 中提及
AI-for-Ocean-Science/ulmo
pytorch
GitHub 中提及
vmboehm/pae-ablation
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-celeba-64x64 | PAE | FID: 49.2 |
| image-generation-on-fashion-mnist | PAE | FID: 28.0 |
| out-of-distribution-detection-on-fashion | PAE | AUROC: 0.997 |
| outlier-detection-on-fashion-mnist | PAE | AUROC: 0.997 |