HyperAIHyperAI

Command Palette

Search for a command to run...

打破Softmax瓶颈:一种高秩RNN语言模型

Zhilin Yang; Zihang Dai; Ruslan Salakhutdinov; William W. Cohen

摘要

我们将语言模型构建为一个矩阵分解问题,并证明了基于Softmax的模型(包括大多数神经语言模型)的表达能力受到Softmax瓶颈的限制。鉴于自然语言具有高度的上下文依赖性,这进一步表明在实际应用中,Softmax结合分布式词嵌入的方法并不具备足够的容量来建模自然语言。我们提出了一种简单而有效的方法来解决这一问题,并将Penn Treebank和WikiText-2数据集上的最新困惑度分别提升至47.69和40.68。所提出的这种方法在大规模1B Word数据集上也表现出色,其困惑度比基线模型提高了超过5.6个点。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供