4 个月前

用于说话人验证的广义端到端损失函数

用于说话人验证的广义端到端损失函数

摘要

在本文中,我们提出了一种新的损失函数,称为广义端到端(GE2E)损失函数,该函数使得说话人验证模型的训练比我们之前提出的基于元组的端到端(TE2E)损失函数更加高效。与TE2E不同,GE2E损失函数在每次训练过程中都强调更新难以验证的样本。此外,GE2E损失函数不需要一个初始的样例选择阶段。凭借这些特性,采用新损失函数的模型将说话人验证的等错误率(EER)降低了超过10%,同时将训练时间减少了60%。我们还引入了MultiReader技术,该技术使我们能够进行领域适应——训练支持多个关键词(例如“OK Google”和“Hey Google”)以及多种方言的更精确模型。

代码仓库

luomingshuang/GE2E-SV-TI-Timit-LMS
pytorch
GitHub 中提及
hanqingguo/GE2E
pytorch
GitHub 中提及
yistLin/dvector
pytorch
GitHub 中提及
JeffT13/rd-diarization
pytorch
GitHub 中提及
Aurora11111/voiceprint
pytorch
GitHub 中提及
JeffT13/VoiceEncoder
pytorch
GitHub 中提及
resemble-ai/Resemblyzer
pytorch
GitHub 中提及
icewing1996/baseline
pytorch
GitHub 中提及
tigthor/Voice-Cloning-AI
pytorch
GitHub 中提及
coqui-ai/TTS
pytorch
GitHub 中提及
yui-mhcp/base_dl_project
tf
GitHub 中提及
cvqluu/GE2E-Loss
pytorch
GitHub 中提及
aijianiula0601/ge2eloss-svf
tf
GitHub 中提及
rf5/simple-speaker-embedding
pytorch
GitHub 中提及
gkv856/speaker_embedding_GE2E_loss
pytorch
GitHub 中提及

基准测试

基准方法指标
speaker-verification-on-callhome-
Cosine EER: 2.38
speaker-verification-on-callhomeGE2E
Cosine EER: 3.55

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于说话人验证的广义端到端损失函数 | 论文 | HyperAI超神经