
摘要
我们提出了一种简单且有效的依存句法分析方案,该方案基于双向长短期记忆网络(BiLSTMs)。每个句子标记都与一个BiLSTM向量相关联,该向量表示标记在其句子上下文中的特征,特征向量通过连接几个BiLSTM向量构建而成。BiLSTM与解析器目标联合训练,从而成为非常有效的解析特征提取器。我们通过将其应用于贪婪转换式解析器以及全局优化的图基解析器来证明该方法的有效性。所得到的解析器具有非常简单的架构,并在英语和汉语上达到了或超过了当前最先进的准确性。
代码仓库
elikip/bist-parser
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| dependency-parsing-on-penn-treebank | BIST transition-based parser | LAS: 91.9 POS: 97.44 UAS: 93.99 |
| dependency-parsing-on-penn-treebank | BIST graph-based parser | LAS: 91.0 POS: 97.3 UAS: 93.1 |