
摘要
本文介绍了 Timers and Such,这是一个全新的开源语音命令数据集,涵盖涉及数字的常见语音控制应用场景中的英语口语指令。文中阐述了现有语音理解数据集在该领域存在的空白,详细说明了该数据集的设计理念与构建过程,并对多种基于自动语音识别(ASR)及端到端的基线模型进行了实验验证。相关代码已作为 SpeechBrain 工具包的一部分公开发布。
代码仓库
speechbrain/speechbrain
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| spoken-language-understanding-on-timers-and | Baseline | Accuracy (%): 81.6 |