HyperAIHyperAI

Command Palette

Search for a command to run...

多人语音分离(未知说话人数量)

Eliya Nachmani Yossi Adi Lior Wolf

摘要

我们提出了一种新的方法,用于分离同时发声的多语音混合音频序列。该方法采用门控神经网络,在多个处理步骤中训练以分离不同语音,同时保持每个输出通道中的说话人身份固定不变。针对每种可能的说话人数量,训练一个独立的模型,并在实际应用中,选用能处理最多说话人数的模型来确定给定音频样本中的真实说话人数。实验结果表明,该方法显著优于当前最先进的技术;如我们所展示的,现有方法在超过两个说话人的情况下已不具备竞争力。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供