
摘要
在本报告中,我们介绍了在2023年声音分离挑战赛(Sound Demixing Challenge 2023)音乐分离赛道中荣获奖项的解决方案。首先,我们提出TFC-TDF-UNet v3,这是一种高效的时间音乐源分离模型,在MUSDB基准测试中取得了当前最优的性能表现。随后,我们详细阐述了针对各排行榜(Leaderboard)所采用的解决方案,其中包括一种用于提升噪声鲁棒性的损失掩码(loss masking)训练方法。模型训练及最终提交结果的复现代码已公开,可访问 github.com/kuielab/sdx23 获取。
代码仓库
kuielab/sdx23
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| music-source-separation-on-musdb18 | TFC-TDF-UNet (v3) | SDR (avg): 8.34 SDR (bass): 8.45 SDR (drums): 8.44 SDR (other): 6.86 SDR (vocals): 9.59 |
| music-source-separation-on-musdb18-hq | TFC-TDF-UNet (v3) | SDR (avg): 8.34 SDR (bass): 8.45 SDR (drums): 8.44 SDR (others): 6.86 SDR (vocals): 9.59 |