
摘要
句子简化旨在简化复杂句子的内容和结构,从而使其更容易被人类读者理解和更易于下游自然语言处理(NLP)应用进行处理。近年来,神经机器翻译的进展为该任务的新方法铺平了道路。在本文中,我们采用了一种具有增强记忆容量的架构——神经语义编码器(Neural Semantic Encoders,Munkhdalai 和 Yu,2017),将其应用于句子简化。实验结果表明,我们的方法在不同的简化数据集上均表现出有效性,无论是在自动评估指标还是人工评价方面。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-simplification-on-newsela | NSELSTM-B | BLEU: 26.31 SARI: 27.42 |
| text-simplification-on-newsela | NSELSTM-S | BLEU: 22.62 SARI: 29.58 |
| text-simplification-on-pwkp-wikismall | NSELSTM-S | BLEU: 29.72 SARI: 29.75 |
| text-simplification-on-pwkp-wikismall | NSELSTM-B | BLEU: 53.42 SARI: 17.47 |
| text-simplification-on-turkcorpus | NSELSTM-B | BLEU: 92.02 SARI (EASSEu003e=0.2.1): 33.43 |
| text-simplification-on-turkcorpus | NSELSTM-S | BLEU: 80.43 SARI (EASSEu003e=0.2.1): 36.88 |