4 个月前

在自动语法错误校正中达到人类水平的表现:一项实证研究

在自动语法错误校正中达到人类水平的表现:一项实证研究

摘要

神经序列到序列(seq2seq)方法在语法错误修正(GEC)方面已被证明是成功的。基于seq2seq框架,我们提出了一种新颖的流畅度增强学习和推理机制。流畅度增强学习在训练过程中生成多样化的错误修正句对,使错误修正模型能够从更多实例中学习如何提高句子的流畅度;而流畅度增强推理则允许模型通过多个推理步骤逐步修正句子。我们将流畅度增强学习和推理机制与卷积序列到序列模型相结合,所提出的方法在CoNLL-2014 10注释数据集上达到了75.72(F_{0.5})的性能,在JFLEG测试集上达到了62.42(GLEU)的性能,分别成为首个在这两个基准测试中达到人类水平表现(CoNLL为72.58,JFLEG为62.37)的GEC系统。

代码仓库

getao/human-performance-gec
官方
GitHub 中提及

基准测试

基准方法指标
grammatical-error-correction-on-unrestrictedCNN Seq2Seq + Fluency Boost and inference
GLEU: 62.37
grammatical-error-correction-on-unrestrictedCNN Seq2Seq + Fluency Boost
F0.5: 61.34

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
在自动语法错误校正中达到人类水平的表现:一项实证研究 | 论文 | HyperAI超神经