
摘要
我们提出了一种新颖的、基于迭代编辑的无监督句子简化方法。该模型由一个包含流畅性、简洁性及语义保留性的评分函数指导,通过在复杂句子上迭代地执行词级和短语级编辑操作来实现简化。与以往方法相比,我们的模型无需平行语料库进行训练,同时具备更强的可控性与可解释性。在Newsela和WikiLarge数据集上的实验表明,该方法的性能接近当前最先进的监督学习方法。
代码仓库
ddhruvkr/Edit-Unsup-TS
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-simplification-on-newsela | Edit-Unsup-TS | BLEU: 17.36 SARI: 30.44 |
| text-simplification-on-turkcorpus | Edit-Unsup-TS | BLEU: 73.62 SARI (EASSEu003e=0.2.1): 37.85 |