4 个月前

残差流用于可逆生成建模

残差流用于可逆生成建模

摘要

基于流的生成模型通过可逆变换参数化概率分布,并可以通过最大似然方法进行训练。可逆残差网络提供了一类灵活的变换,其中只需满足Lipschitz条件而非严格的架构约束即可保证可逆性。然而,先前的研究在使用可逆残差网络进行密度估计时依赖于有偏的对数密度估计,这些估计的偏差随着网络表达能力的增强而增加。我们提出了一种利用“俄罗斯轮盘”估计器的对数密度无偏估计方法,并通过使用替代的无穷级数来计算梯度,从而减少了训练过程中所需的内存。此外,我们通过引入避免导数饱和的激活函数以及将Lipschitz条件推广到诱导混合范数,改进了可逆残差块。所提出的这种方法称为残差流(Residual Flows),在基于流的模型中实现了最先进的密度估计性能,并且在联合生成和判别建模方面优于使用耦合块的网络。

代码仓库

thu-ml/implicit-normalizing-flows
pytorch
GitHub 中提及
rtqichen/residual-flows
官方
pytorch
GitHub 中提及
eyalbetzalel/residual-flows
pytorch
GitHub 中提及

基准测试

基准方法指标
image-generation-on-celeba-256x256Residual Flow
bpd: 0.992
image-generation-on-cifar-10Residual Flow
FID: 46.37
image-generation-on-imagenet-32x32Residual Flow
bpd: 4.01
image-generation-on-imagenet-64x64Residual Flow
Bits per dim: 3.757
image-generation-on-mnistResidual Flow
bits/dimension: 0.97

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
残差流用于可逆生成建模 | 论文 | HyperAI超神经