
摘要
基于知识的身份验证对于提供个性化和隐私保护服务的任务导向型语音对话系统至关重要。此类系统应能够根据用户的个人信息(如邮政编码、姓名和出生日期)注册(E)、验证(V)和识别(I)新用户和回头用户。在本研究中,我们对这三项身份验证任务及其评估协议进行了形式化定义,并介绍了EVI,这是一个具有挑战性的多语言语音数据集,包含5,506段英语、波兰语和法语的对话。我们提出的模型设定了首个有竞争力的基准,探讨了多语言语音对话的自然语言处理所面临的挑战,并为未来的研究指明了方向。
代码仓库
PolyAI-LDN/evi-paper
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| speaker-identification-on-evi-en-gb-1 | Fuzzy Retrieval | Top-1 (%): 67.77 |
| speaker-identification-on-evi-fr-fr | Fuzzy Retrieval | Top-1 (%): 80.83 |
| speaker-identification-on-evi-pl-pl | Fuzzy Retrieval | Top-1 (%): 95.13 |