
摘要
本文介绍了我们提交至IWSLT 2020离线语音翻译任务的系统。我们采用Transformer架构,并结合元学习(meta-learning)方法,构建了一个端到端的语音到文本翻译(Speech-to-Text Translation, ST)系统。该元学习方法通过利用自动语音识别(ASR)和机器翻译(MT)任务中已有的数据,有效缓解了语音翻译任务中数据稀缺的问题。将元学习方法与合成数据增强技术相结合,显著提升了模型性能,在IWSLT 2015测试集、MuST-C测试集和Europarl-ST测试集上分别取得了24.58、27.51和27.61的BLEU得分。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| speech-to-text-translation-on-must-c-en-de | Transformer + Meta Learning(ASR/MT) + Data Augmentation | Case-sensitive sacreBLEU: 27.51 |