3 个月前

2023年声音分离挑战赛 音乐分离赛道 技术报告:TFC-TDF-UNet v3

2023年声音分离挑战赛 音乐分离赛道 技术报告:TFC-TDF-UNet v3

摘要

在本报告中,我们介绍了在2023年声音分离挑战赛(Sound Demixing Challenge 2023)音乐分离赛道中荣获奖项的解决方案。首先,我们提出TFC-TDF-UNet v3,这是一种高效的时间音乐源分离模型,在MUSDB基准测试中取得了当前最优的性能表现。随后,我们详细阐述了针对各排行榜(Leaderboard)所采用的解决方案,其中包括一种用于提升噪声鲁棒性的损失掩码(loss masking)训练方法。模型训练及最终提交结果的复现代码已公开,可访问 github.com/kuielab/sdx23 获取。

代码仓库

kuielab/sdx23
官方
pytorch

基准测试

基准方法指标
music-source-separation-on-musdb18TFC-TDF-UNet (v3)
SDR (avg): 8.34
SDR (bass): 8.45
SDR (drums): 8.44
SDR (other): 6.86
SDR (vocals): 9.59
music-source-separation-on-musdb18-hqTFC-TDF-UNet (v3)
SDR (avg): 8.34
SDR (bass): 8.45
SDR (drums): 8.44
SDR (others): 6.86
SDR (vocals): 9.59

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
2023年声音分离挑战赛 音乐分离赛道 技术报告:TFC-TDF-UNet v3 | 论文 | HyperAI超神经