4 个月前

通过联合学习句法和词汇的神经语言模型

通过联合学习句法和词汇的神经语言模型

摘要

我们提出了一种能够进行无监督句法结构诱导的神经语言模型。该模型利用结构信息形成更好的语义表示和更优的语言模型。传统的循环神经网络由于其结构限制,无法高效地利用句法信息。另一方面,树形递归网络通常需要额外的结构监督,这需要人工专家标注的成本。在本文中,我们提出了一种新颖的神经语言模型,称为解析-阅读-预测网络(Parsing-Reading-Predict Networks, PRPN),该模型可以同时从未标注的句子中诱导出句法结构,并利用推断出的结构学习更优的语言模型。在我们的模型中,梯度可以直接从语言模型损失反向传播到神经解析网络中。实验结果表明,所提出的模型能够发现潜在的句法结构,并在词/字符级别的语言模型任务上达到最先进的性能。

代码仓库

nyu-mll/PRPN-Analysis
pytorch
GitHub 中提及

基准测试

基准方法指标
constituency-grammar-induction-on-ptbPRPN
Max F1 (WSJ): 38.1
constituency-grammar-induction-on-ptbPRPN (tuned)
Max F1 (WSJ): 47.9
Mean F1 (WSJ): 47.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过联合学习句法和词汇的神经语言模型 | 论文 | HyperAI超神经