3 个月前

低资源场景下的语法错误纠正

低资源场景下的语法错误纠正

摘要

英语语法错误修正是一个长期研究的课题,已有众多系统和数据集问世。然而,针对其他语言的语法错误修正研究仍十分有限。本文提出了一项针对捷克语的新型语法错误修正数据集——AKCES-GEC。随后,我们在捷克语、德语和俄语上进行了实验,结果表明,通过使用合成的平行语料库,基于Transformer的神经机器翻译模型在这些数据集上均取得了新的最先进(state-of-the-art)性能。AKCES-GEC数据集以CC BY-NC-SA 4.0许可协议发布,可通过以下链接获取:https://hdl.handle.net/11234/1-3057;相关GEC模型的源代码可在GitHub上获取:https://github.com/ufal/low-resource-gec-wnut2019。

基准测试

基准方法指标
grammatical-error-correction-on-falko-merlinTransformer - synthetic pretrain only
F0.5: 51.41
grammatical-error-correction-on-falko-merlinTransformer
F0.5: 73.71

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
低资源场景下的语法错误纠正 | 论文 | HyperAI超神经