3 个月前

自回归模型中的局部掩码卷积

自回归模型中的局部掩码卷积

摘要

高维生成模型在图像压缩、多媒体生成、异常检测和数据补全等多个领域具有广泛应用。当前针对自然图像的先进估计方法多采用自回归模型,将像素的联合分布分解为一系列条件概率的乘积,并由深度神经网络(如卷积神经网络)进行参数化,例如PixelCNN。然而,PixelCNN仅能建模联合分布的一种特定分解方式,且仅在单一生成顺序下效率较高。在图像补全等任务中,这类模型难以充分利用已观测到的上下文信息。为实现任意生成顺序下的数据生成,我们提出LMConv:一种对标准二维卷积的简单改进,可在图像每个位置上对权重施加任意掩码。利用LMConv,我们训练了一个共享参数但生成顺序不同的分布估计器集成模型,在整图密度估计任务中取得了优异性能(在无条件CIFAR-10数据集上达到2.89比特/像素),同时实现了全局一致的图像补全效果。相关代码已公开,可访问 https://ajayjain.github.io/lmconv。

代码仓库

ajayjain/lmconv
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-generation-on-binarized-mnistLocally Masked PixelCNN (8 orders)
bits/dimension: 0.143
nats: 77.58
image-generation-on-celeba-256x256Locally Masked PixelCNN
bpd: 0.74
image-generation-on-mnistLocally Masked PixelCNN (8 orders)
bits/dimension: 0.65

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
自回归模型中的局部掩码卷积 | 论文 | HyperAI超神经