
摘要
本文研究了基于通用序列到序列(sequence-to-sequence)模型构建强基准(strong baseline)用于短语结构句法分析(constituency parsing)的方法。我们引入了在自然语言生成任务(如机器翻译和文本摘要)中发展起来的多种技术,实证表明,仅通过这些通用技术,序列到序列模型即可达到当前顶尖句法分析器的性能水平,几乎无需依赖任何特定于句法分析任务的显式知识或专用架构。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| constituency-parsing-on-penn-treebank | LSTM Encoder-Decoder + LSTM-LM | F1 score: 94.32 |