4 个月前

基于时域嵌入的抗欺骗串联自动说话人验证

基于时域嵌入的抗欺骗串联自动说话人验证

摘要

防欺骗自动说话人验证(SASV)系统是保护免受伪造语音攻击的关键技术。在本研究中,我们重点关注逻辑访问攻击,并提出了一种新的SASV方法。该方法基于时域波形幅度的概率质量函数(PMF),生成了真实和伪造语音的新表示。这一方法论从训练集中选定的组别生成了基于PMF的新颖时间嵌入。本文强调了性别分离的作用及其对性能的积极影响。我们提出了一种反制措施(CM)系统,该系统利用真实和伪造语音的时域嵌入以及基于男性和女性时间嵌入的性别识别。该方法表现出显著的性别识别能力,男性的不匹配率为0.94%,女性为1.79%。男性和女性CM系统的等错误率(EER)分别为8.67%和10.12%。通过将这种方法与传统的说话人验证系统相结合,我们在ASVspoof2019挑战数据库上展示了改进的泛化能力和串联检测成本函数评估。此外,我们探讨了将时间嵌入方法与传统CM融合的影响,并说明了这种融合如何增强SASV架构的泛化能力。

基准测试

基准方法指标
speaker-verification-on-asvspoof-2019-laECAPA-TDNN
minDCF: 0.004
voice-anti-spoofing-on-asvspoof-2019-laOCSoftmax+GD
EER: 2.62%
voice-anti-spoofing-on-asvspoof-2019-laGD
EER: 9.68%
min a-DCF: 0.1684
min t-dcf: 0.2709

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于时域嵌入的抗欺骗串联自动说话人验证 | 论文 | HyperAI超神经