HyperAI超神经

摘要

PixelCNN 是一类最近提出的强大生成模型，具有可计算的似然性。本文讨论了我们在 https://github.com/openai/pixel-cnn 上实现的 PixelCNN 模型。我们的实现对原始模型进行了若干修改，这些修改不仅简化了模型结构，还提高了其性能。1) 我们在像素上使用了离散化的 Logistic 混合似然性（discretized logistic mixture likelihood），而不是 256 路 softmax，这加速了训练过程。2) 我们基于整个像素进行条件建模，而不是红绿蓝（R/G/B）子像素，从而简化了模型结构。3) 我们通过下采样高效地捕捉多分辨率下的结构特征。4) 我们引入了额外的短连接（short-cut connections），以进一步加快优化速度。5) 我们使用 dropout 对模型进行正则化。最后，我们展示了在 CIFAR-10 数据集上的最新对数似然结果，以证明这些修改的有效性。

摘要

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

摘要

用 AI 构建 AI

HyperAI Newsletters

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

摘要

用 AI 构建 AI

HyperAI Newsletters

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

PixelCNN++：通过离散对数混合似然和其他改进优化PixelCNN

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

PixelCNN++：通过离散对数混合似然和其他改进优化PixelCNN

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

PixelCNN++：通过离散对数混合似然和其他改进优化PixelCNN

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

摘要

用 AI 构建 AI

HyperAI Newsletters