4 个月前

归一化流是强大的生成模型

归一化流是强大的生成模型

摘要

归一化流(Normalizing Flows, NFs)是用于连续输入的基于似然性的模型。它们在密度估计和生成建模任务中展示了令人鼓舞的结果,但在近年来并未受到足够的关注。在这项工作中,我们证明了归一化流比之前认为的更为强大。我们提出了TarFlow:一种简单且可扩展的架构,能够实现高性能的归一化流模型。TarFlow可以被视为Masked Autoregressive Flows(MAFs)的一种基于Transformer的变体,它由图像块上的自回归Transformer块堆叠而成,并在各层之间交替自回归方向。TarFlow可以端到端地进行训练,并能够直接对像素进行建模和生成。此外,我们还提出了三种关键技术来提高样本质量:训练期间的高斯噪声增强、训练后的去噪过程以及有效的引导方法,适用于有类别条件和无条件设置。综合这些技术,TarFlow在图像似然估计方面取得了新的最佳结果,大幅超越了之前的最优方法,并首次以独立的归一化流模型生成了与扩散模型质量相当且多样化的样本。我们的代码已开源,可在https://github.com/apple/ml-tarflow 获取。

基准测试

基准方法指标
image-generation-on-imagenet-128x128TarFlow
FID: 5.03
image-generation-on-imagenet-64x64TarFlow
Bits per dim: 2.99
FID: 2.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
归一化流是强大的生成模型 | 论文 | HyperAI超神经