
摘要
句子拆分是一种重要的简化操作。本文提出了一种基于自动语义解析器的简单高效的拆分算法。拆分后,文本更易于进行进一步的微调简化操作。特别是,我们展示了在这种情况下可以有效使用神经机器翻译(Neural Machine Translation)。以往将机器翻译应用于简化时存在一个显著的缺点,即过于保守,经常无法对源文本进行任何修改。本文提出的基于语义解析的拆分方法缓解了这一问题。广泛的自动评估和人工评估表明,所提出的方法在词汇和结构综合简化方面与现有最先进方法相比具有优势。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-simplification-on-turkcorpus | SEMoses | BLEU: 74.49 SARI (EASSEu003e=0.2.1): 36.70 |