4 个月前

BIVA：用于生成建模的非常深层的潜在变量层次结构

Lars Maaløe; Marco Fraccaro; Valentin Liévin; Ole Winther

摘要

随着变分自编码器（Variational Autoencoder, VAE）的引入，概率潜在变量模型作为强大的生成模型再次受到关注。然而，在测试似然性和生成样本质量方面，其性能已被没有随机单元的自回归模型所超越。此外，基于流的模型最近被证明是一种可扩展到高维数据的有吸引力的替代方案。在本文中，我们通过构建能够有效利用深层随机变量层次结构并建模复杂协方差结构的VAE模型，缩小了这一性能差距。我们介绍了双向推理变分自编码器（Bidirectional-Inference Variational Autoencoder, BIVA），该模型的特点是具有跳跃连接的生成模型和由双向随机推理路径组成的推断网络。我们展示了BIVA达到了最先进的测试似然性，生成了清晰且连贯的自然图像，并利用潜在变量的层次结构捕捉数据分布的不同方面。我们观察到，与近期结果不同的是，BIVA可以用于异常检测。我们认为这是由于潜在变量的层次结构能够提取高层次的语义特征。最后，我们将BIVA扩展到半监督分类任务中，并展示其性能与生成对抗网络（Generative Adversarial Networks, GANs）达到的最佳结果相当。

代码仓库

larsmaaloee/BIVA

vlievin/biva-pytorch

pytorch

基准测试

基准	方法	指标
image-generation-on-imagenet-32x32	BIVA Maaloe et al. (2019)	bpd: 3.96

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供