
摘要
在本文中,我们提出了一种新的损失函数,称为广义端到端(GE2E)损失函数,该函数使得说话人验证模型的训练比我们之前提出的基于元组的端到端(TE2E)损失函数更加高效。与TE2E不同,GE2E损失函数在每次训练过程中都强调更新难以验证的样本。此外,GE2E损失函数不需要一个初始的样例选择阶段。凭借这些特性,采用新损失函数的模型将说话人验证的等错误率(EER)降低了超过10%,同时将训练时间减少了60%。我们还引入了MultiReader技术,该技术使我们能够进行领域适应——训练支持多个关键词(例如“OK Google”和“Hey Google”)以及多种方言的更精确模型。
代码仓库
luomingshuang/GE2E-SV-TI-Timit-LMS
pytorch
GitHub 中提及
luomingshuang/GE2E-SV-TI-thchs30-LMS
pytorch
GitHub 中提及
hanqingguo/GE2E
pytorch
GitHub 中提及
yistLin/dvector
pytorch
GitHub 中提及
JeffT13/rd-diarization
pytorch
GitHub 中提及
Aurora11111/voiceprint
pytorch
GitHub 中提及
Aurora11111/speaker-recognition-pytorch
pytorch
GitHub 中提及
JeffT13/VoiceEncoder
pytorch
GitHub 中提及
resemble-ai/Resemblyzer
pytorch
GitHub 中提及
luomingshuang/GE2E-SV-TI-Chinese-LMS
pytorch
GitHub 中提及
HarryVolek/PyTorch_Speaker_Verification
pytorch
GitHub 中提及
Janghyun1230/Speaker_Verification
tf
GitHub 中提及
icewing1996/baseline
pytorch
GitHub 中提及
Suhee05/Text-Independent-Speaker-Verification
tf
GitHub 中提及
CorentinJ/Real-Time-Voice-Cloning
tf
GitHub 中提及
tigthor/Voice-Cloning-AI
pytorch
GitHub 中提及
coqui-ai/TTS
pytorch
GitHub 中提及
yui-mhcp/base_dl_project
tf
GitHub 中提及
cvqluu/GE2E-Loss
pytorch
GitHub 中提及
JanhHyun/Speaker_Verification
tf
GitHub 中提及
aijianiula0601/ge2eloss-svf
tf
GitHub 中提及
luomingshuang/GE2E-SV-TI-Voxceleb-LMS
pytorch
GitHub 中提及
rf5/simple-speaker-embedding
pytorch
GitHub 中提及
gkv856/speaker_embedding_GE2E_loss
pytorch
GitHub 中提及
muskang48/Speaker-Diarization
tf
GitHub 中提及
zhangmin4215/PyTorch_Speaker_Verification
pytorch
GitHub 中提及
piotrkawa/audio-deepfake-source-tracing
pytorch
GitHub 中提及
dalonlobo/diarization-experiments
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| speaker-verification-on-callhome | - | Cosine EER: 2.38 |
| speaker-verification-on-callhome | GE2E | Cosine EER: 3.55 |