4 个月前

PixelCNN++:通过离散对数混合似然和其他改进优化PixelCNN

PixelCNN++:通过离散对数混合似然和其他改进优化PixelCNN

摘要

PixelCNN 是一类最近提出的强大生成模型,具有可计算的似然性。本文讨论了我们在 https://github.com/openai/pixel-cnn 上实现的 PixelCNN 模型。我们的实现对原始模型进行了若干修改,这些修改不仅简化了模型结构,还提高了其性能。1) 我们在像素上使用了离散化的 Logistic 混合似然性(discretized logistic mixture likelihood),而不是 256 路 softmax,这加速了训练过程。2) 我们基于整个像素进行条件建模,而不是红绿蓝(R/G/B)子像素,从而简化了模型结构。3) 我们通过下采样高效地捕捉多分辨率下的结构特征。4) 我们引入了额外的短连接(short-cut connections),以进一步加快优化速度。5) 我们使用 dropout 对模型进行正则化。最后,我们展示了在 CIFAR-10 数据集上的最新对数似然结果,以证明这些修改的有效性。

基准测试

基准方法指标
density-estimation-on-cifar-10Pixel CNN ++
NLL (bits/dim): 2.92

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PixelCNN++:通过离散对数混合似然和其他改进优化PixelCNN | 论文 | HyperAI超神经