4 个月前

利用单语数据改进神经机器翻译模型

利用单语数据改进神经机器翻译模型

摘要

神经机器翻译(NMT)在多种语言对上取得了最先进的性能,而仅使用平行数据进行训练。目标端单语数据在提高基于短语的统计机器翻译的流畅性方面起着重要作用,我们研究了单语数据在神经机器翻译中的应用。与之前的工作不同,这些工作将NMT模型与单独训练的语言模型结合,我们注意到编码器-解码器NMT架构已经具备学习与语言模型相同信息的能力,因此我们探索了在不改变神经网络架构的情况下利用单语数据进行训练的策略。通过将单语训练数据与其自动回译结果配对,我们可以将其视为额外的平行训练数据,并在WMT 15英德双向翻译任务中获得了显著改进(+2.8至3.7 BLEU分),以及在资源较少的IWSLT 14土耳其语到英语翻译任务中也取得了显著提升(+2.1至3.4 BLEU分),从而获得了新的最先进成果。此外,我们还展示了在特定领域内的单语和平行数据上进行微调可以为IWSLT 15英德翻译任务带来显著改进。

代码仓库

surafelml/Afro-NMT
tf
GitHub 中提及
josephch405/curriculum-nmt
pytorch
GitHub 中提及

基准测试

基准方法指标
cross-lingual-bitext-mining-on-bucc-french-toMonolingual training data
F1 score: 75.8
cross-lingual-bitext-mining-on-bucc-german-toMonolingual training data
F1 score: 76.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
利用单语数据改进神经机器翻译模型 | 论文 | HyperAI超神经