3 个月前

生成式想象提升机器翻译

生成式想象提升机器翻译

摘要

文本与图像之间存在共享的语义信息。给定一种源语言的句子,借助视觉场景描述是否有助于其翻译成目标语言?现有的多模态神经机器翻译方法(MNMT)在训练时需要双语句子-图像三元组,推理时也需要源句子-图像的组合。本文提出 ImagiT,一种通过视觉想象实现的新型机器翻译方法。ImagiT 首先学习从源语言句子生成视觉表征,然后结合源句子与“想象出的视觉表征”来生成目标语言翻译结果。与以往方法不同,ImagiT 在推理阶段仅需源句子即可完成翻译。实验结果表明,ImagiT 通过视觉想象显著提升了翻译性能,明显优于仅依赖文本的神经机器翻译基线模型。进一步分析发现,ImagiT 中的想象过程在执行退化策略(degradation strategy)时,有助于补全缺失的信息。

基准测试

基准方法指标
multimodal-machine-translation-on-multi30kImagiT
BLEU (EN-DE): 38.4
Meteor (EN-DE): 55.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
生成式想象提升机器翻译 | 论文 | HyperAI超神经