
摘要
本文介绍了一个名为“Speechocean762”的新开放源代码语音语料库,该语料库专为发音评估设计,包含来自250名非母语者的5000个英语发音样本,其中一半的发音者为儿童。每条发音样本均由五位专家在句子级、单词级和音素级进行了标注。为了说明在此语料库上进行音素级发音评估的工作流程,已发布了一个开放源代码的基线系统。该语料库允许免费用于商业和非商业目的。用户可从OpenSLR网站免费下载该语料库,相应的基线系统则发布在Kaldi语音识别工具包中。
代码仓库
YuanGongND/gopt
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| phone-level-pronunciation-scoring-on | GOP | Pearson correlation coefficient (PCC): 0.45 |