3 个月前

CleanUNet 2:基于波形与谱图的混合语音去噪模型

CleanUNet 2:基于波形与谱图的混合语音去噪模型

摘要

在本工作中,我们提出CleanUNet 2,一种结合波形去噪器与频谱图去噪器优势的语音去噪模型,实现了两者的最佳融合。CleanUNet 2采用受主流语音合成方法启发的两阶段框架,该框架由波形模型与频谱图模型组成。具体而言,CleanUNet 2在当前最先进的波形去噪器CleanUNet的基础上进行改进,通过将频谱图去噪器预测的频谱图作为输入,进一步提升了模型性能。实验结果表明,CleanUNet 2在多项客观与主观评估指标上均优于以往方法。

基准测试

基准方法指标
speech-enhancement-on-deep-noise-suppressionCleanUNet-2
PESQ-NB: 3.658
PESQ-WB: 3.262

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CleanUNet 2:基于波形与谱图的混合语音去噪模型 | 论文 | HyperAI超神经