
摘要
我们将两种最流行的自动化语法错误纠正(GEC)方法结合起来:基于统计机器翻译(SMT)的GEC和基于神经机器翻译(NMT)的GEC。该混合系统在CoNLL-2014和JFLEG基准测试中取得了新的最佳结果。此GEC系统不仅保留了SMT输出的准确性,同时生成了更加流畅的句子,这是NMT的典型特征。我们的分析表明,所创建的系统比迄今为止报告的任何其他GEC系统更接近达到人类水平的表现。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| grammatical-error-correction-on-conll-2014 | SMT + BiGRU | F0.5: 56.25 |
| grammatical-error-correction-on-conll-2014-1 | SMT + BiGRU | F0.5: 72.04 |
| grammatical-error-correction-on-jfleg | SMT + BiGRU | GLEU: 61.5 |