4 个月前

Speechocean762:一个开源的非母语英语发音评估语料库

Speechocean762:一个开源的非母语英语发音评估语料库

摘要

本文介绍了一个名为“Speechocean762”的新开放源代码语音语料库,该语料库专为发音评估设计,包含来自250名非母语者的5000个英语发音样本,其中一半的发音者为儿童。每条发音样本均由五位专家在句子级、单词级和音素级进行了标注。为了说明在此语料库上进行音素级发音评估的工作流程,已发布了一个开放源代码的基线系统。该语料库允许免费用于商业和非商业目的。用户可从OpenSLR网站免费下载该语料库,相应的基线系统则发布在Kaldi语音识别工具包中。

基准测试

基准方法指标
phone-level-pronunciation-scoring-onGOP
Pearson correlation coefficient (PCC): 0.45

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Speechocean762:一个开源的非母语英语发音评估语料库 | 论文 | HyperAI超神经