
摘要
句子简化旨在使句子更容易阅读和理解。大多数最近的方法借鉴了机器翻译的见解,从单语复杂句和简单句语料库中学习简化重写。我们通过结合编码器-解码器模型和深度强化学习框架来解决简化问题。我们的模型称为{\sc Dress}(即{\bf D}eep {\bf RE}inforcement {\bf S}entence {\bf S}implification的缩写),在探索可能的简化空间的同时,学习优化一个奖励函数,该函数鼓励输出既简单又流畅且保留输入意义的结果。在三个数据集上的实验表明,我们的模型优于竞争性的简化系统。
代码仓库
XingxingZhang/dress
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-simplification-on-asset | Dress-LS | BLEU: 86.39* SARI (EASSEu003e=0.2.1): 36.59 |
| text-simplification-on-newsela | DRESS | BLEU: 23.21 SARI: 27.37 |
| text-simplification-on-newsela | DRESS-LS | BLEU: 24.30 SARI: 26.63 |
| text-simplification-on-pwkp-wikismall | DRESS | BLEU: 34.53 SARI: 27.48 |
| text-simplification-on-pwkp-wikismall | DRESS-LS | BLEU: 36.32 SARI: 27.24 |
| text-simplification-on-turkcorpus | Dress | BLEU: 77.18 SARI (EASSEu003e=0.2.1): 37.08 |
| text-simplification-on-turkcorpus | Dress-LS | BLEU: 80.12 SARI (EASSEu003e=0.2.1): 37.27 |