7 个月前

自然语言处理

自然语言处理

Raffel, Colin Shazeer, Noam Zhang, Ying Le, Quoc Mitchell, Tomas

摘要

机器翻译系统在某些语言上已经达到了接近人类水平的性能，但其有效性在很大程度上依赖于大量平行句对的存在，这限制了它们在大多数语言对中的应用。本研究探讨了仅利用每种语言的大规模单语语料库进行翻译学习的方法。我们提出了两种模型变体，一种是神经网络模型，另一种是基于短语的模型。这两种版本都利用了参数的精心初始化、语言模型的去噪效果以及通过迭代回译自动生成平行数据的技术。这些模型不仅显著优于文献中的方法，而且更为简单，超参数也更少。在广泛使用的WMT'14英法和WMT'16德英基准测试中，我们的模型分别在未使用任何平行句对的情况下获得了28.1和25.2的BLEU分数，比现有最佳方法高出超过11个BLEU点。对于资源较少的语言如英乌尔都语和英罗曼尼亚语，我们的方法甚至优于利用少量可用双语文本的半监督和监督方法。我们的NMT（神经机器翻译）和PBSMT（基于短语的统计机器翻译）代码已公开发布。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

自然语言处理

自然语言处理

Raffel, Colin Shazeer, Noam Zhang, Ying Le, Quoc Mitchell, Tomas

摘要

机器翻译系统在某些语言上已经达到了接近人类水平的性能，但其有效性在很大程度上依赖于大量平行句对的存在，这限制了它们在大多数语言对中的应用。本研究探讨了仅利用每种语言的大规模单语语料库进行翻译学习的方法。我们提出了两种模型变体，一种是神经网络模型，另一种是基于短语的模型。这两种版本都利用了参数的精心初始化、语言模型的去噪效果以及通过迭代回译自动生成平行数据的技术。这些模型不仅显著优于文献中的方法，而且更为简单，超参数也更少。在广泛使用的WMT'14英法和WMT'16德英基准测试中，我们的模型分别在未使用任何平行句对的情况下获得了28.1和25.2的BLEU分数，比现有最佳方法高出超过11个BLEU点。对于资源较少的语言如英乌尔都语和英罗曼尼亚语，我们的方法甚至优于利用少量可用双语文本的半监督和监督方法。我们的NMT（神经机器翻译）和PBSMT（基于短语的统计机器翻译）代码已公开发布。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

基于短语和神经网络的无监督机器翻译 | 论文 | HyperAI超神经