3 个月前

基于时域嵌入的抗欺骗说话人验证

基于时域嵌入的抗欺骗说话人验证

摘要

抗欺骗语音验证技术旨在保护基于语音的认证系统免受伪造攻击。此类系统应具备识别伪造语音片段的能力,并能够验证被判定为真实的语音片段确由真实说话人生成。本研究提出一种基于时域波形幅值概率质量函数(probability mass function)的可解释、可理解的嵌入表示方法。实验结果表明,当该反欺骗(Countermeasure, CM)系统采用性别相关策略时,其性能显著提升。研究采用ASVspoof2019挑战赛中的逻辑访问(Logical Access, LA)数据库进行评估。对于男性语音,该性别相关CM系统的等错误率(Equal Error Rate, EER)为9.2%;对于女性语音,EER为10.1%。相比之下,性别无关的CM系统EER为10.2%。在基于串联评估(tandem assessment, t-DCF)的检测代价函数(detection cost function)指标下,性别相关系统的性能为0.262,而性别无关系统为0.328,进一步验证了性别相关策略在提升系统鲁棒性方面的有效性。

基准测试

基准方法指标
voice-anti-spoofing-on-asvspoof-2019-laECAPA-TDNN
minDCF: 0.0044
voice-anti-spoofing-on-asvspoof-2019-laSpoofing-robust speaker verification
min t-dcf: 0.2620
voice-anti-spoofing-on-asvspoof-2019-laPMF-based time embedding
EER: 9.87

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于时域嵌入的抗欺骗说话人验证 | 论文 | HyperAI超神经