3 个月前

任务感知的多任务学习在语音转文本任务中的应用

任务感知的多任务学习在语音转文本任务中的应用

摘要

通常情况下,直接语音到文本的翻译(Speech-to-Text Translation, ST)任务与自动语音识别(Automatic Speech Recognition, ASR)及机器翻译(Machine Translation, MT)任务采用联合训练的方式。然而,当前的联合学习策略在任务间知识迁移方面存在局限。为此,我们提出一种任务调制网络(task modulation network),该网络使模型能够在学习共享特征的同时,有效捕捉各任务特有的特征。该方法无需额外的微调步骤,从而实现一个统一的端到端模型,可同时完成ST、ASR与MT三项任务。该单一模型在ST任务的MuST-C英语-德语数据集上取得了28.64的BLEU得分,在ASR任务的TEDLium v3数据集上达到11.61%的词错误率(WER),在MT任务的WMT’15英语-德语数据集上获得23.35的BLEU得分。该成果在ST任务上刷新了当前最优性能(State-of-the-Art, SOTA),同时显著优于现有的端到端ASR系统。

基准测试

基准方法指标
speech-to-text-translation-on-must-c-en-deTask Modulation + Multitask Learning(ASR/MT) + Data Augmentation
Case-sensitive sacreBLEU: 28.88

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
任务感知的多任务学习在语音转文本任务中的应用 | 论文 | HyperAI超神经