8 个月前

音频和语音处理

Avishai Weizman Yehuda Ben-Shimol Itshak Lapidot

摘要

防欺骗自动说话人验证（SASV）系统是保护免受伪造语音攻击的关键技术。在本研究中，我们重点关注逻辑访问攻击，并提出了一种新的SASV方法。该方法基于时域波形幅度的概率质量函数（PMF），生成了真实和伪造语音的新表示。这一方法论从训练集中选定的组别生成了基于PMF的新颖时间嵌入。本文强调了性别分离的作用及其对性能的积极影响。我们提出了一种反制措施（CM）系统，该系统利用真实和伪造语音的时域嵌入以及基于男性和女性时间嵌入的性别识别。该方法表现出显著的性别识别能力，男性的不匹配率为0.94%，女性为1.79%。男性和女性CM系统的等错误率（EER）分别为8.67%和10.12%。通过将这种方法与传统的说话人验证系统相结合，我们在ASVspoof2019挑战数据库上展示了改进的泛化能力和串联检测成本函数评估。此外，我们探讨了将时间嵌入方法与传统CM融合的影响，并说明了这种融合如何增强SASV架构的泛化能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

音频和语音处理

Avishai Weizman Yehuda Ben-Shimol Itshak Lapidot

摘要

防欺骗自动说话人验证（SASV）系统是保护免受伪造语音攻击的关键技术。在本研究中，我们重点关注逻辑访问攻击，并提出了一种新的SASV方法。该方法基于时域波形幅度的概率质量函数（PMF），生成了真实和伪造语音的新表示。这一方法论从训练集中选定的组别生成了基于PMF的新颖时间嵌入。本文强调了性别分离的作用及其对性能的积极影响。我们提出了一种反制措施（CM）系统，该系统利用真实和伪造语音的时域嵌入以及基于男性和女性时间嵌入的性别识别。该方法表现出显著的性别识别能力，男性的不匹配率为0.94%，女性为1.79%。男性和女性CM系统的等错误率（EER）分别为8.67%和10.12%。通过将这种方法与传统的说话人验证系统相结合，我们在ASVspoof2019挑战数据库上展示了改进的泛化能力和串联检测成本函数评估。此外，我们探讨了将时间嵌入方法与传统CM融合的影响，并说明了这种融合如何增强SASV架构的泛化能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

基于时域嵌入的抗欺骗串联自动说话人验证 | 论文 | HyperAI超神经