
摘要
序列到序列模型在广泛的应用中表现出色。然而,由于相对有限的标注数据量和抽象意义表示(AMR)图的非顺序性质,这些模型在解析和生成使用AMR的文本方面应用有限。本文提出了一种新颖的训练方法,该方法可以通过数百万条未标注的句子和对AMR图进行仔细预处理来克服这一限制。对于AMR解析,我们的模型达到了62.1 SMATCH的竞争性结果,这是目前在不显著使用外部语义资源的情况下报告的最佳分数。对于AMR生成,我们的模型实现了33.8 BLEU的新纪录性能。我们进行了广泛的消融分析和定性分析,提供了强有力的证据表明基于序列的AMR模型对图到序列转换中的顺序变化具有鲁棒性。
代码仓库
freesunshine0316/neural-graph-to-seq-mp
tf
GitHub 中提及
facebookresearch/m-amr2text
pytorch
GitHub 中提及
Cartus/DCGCN
mxnet
GitHub 中提及
sinantie/NeuralAmr
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| amr-parsing-on-ldc2015e86-1 | SEQ2SEQ + 20M | Smatch: 62.1 |