7 个月前

摘要

描述了一个用于训练和评估关键词识别系统的语音数据集。讨论了为什么这一任务是一个有趣的挑战，以及为什么它需要一个不同于传统用于完整句子自动语音识别的数据集的专门数据集。提出了一种可重复且可比较的准确率度量方法。介绍了数据的收集和验证过程，数据集中包含的内容，以往版本及其特性。最后报告了在该数据集上训练的模型的基线结果。

源 PDF