
摘要
在本项工作中,我们展示了如何将一个公开可用的预训练Jukebox模型应用于单通道混合音频中的音频源分离问题。我们提出的神经网络架构采用迁移学习策略,训练过程快速高效,其性能表现与其它需要大量计算资源、训练数据及训练时间的前沿方法相当。我们已将该架构的开源代码实现发布(https://github.com/wzaielamri/unmix),以供学术界和工业界参考与使用。
代码仓库
wzaielamri/unmix
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| music-source-separation-on-musdb18-hq | Unmix | SDR (avg): 4.188 SDR (bass): 4.073 SDR (drums): 4.925 SDR (others): 2.695 SDR (vocals): 5.06 |