4 个月前

ByteCover3:基于短查询的精确翻唱歌曲识别

ByteCover3:基于短查询的精确翻唱歌曲识别

摘要

基于深度学习的方法近年来已成为封面歌曲识别(CSI)的范式,其中ByteCover系统在所有主流CSI数据集上均取得了最先进的结果。然而,随着短视频的兴起,许多实际应用需要将短音乐片段与数据库中的全长音乐曲目进行匹配,这一领域仍处于探索阶段,亟待工业级解决方案的出现。本文中,我们将之前的ByteCover系统升级为ByteCover3,该系统利用局部特征进一步提升了对短音乐查询的识别性能。ByteCover3设计了局部对齐损失(Local Alignment Loss, LAL)模块和两阶段特征检索管道,使得系统能够以更高的精度和效率执行CSI任务。我们使用多个不同基准设置的数据集对ByteCover3进行了评估,在这些评估中,ByteCover3超越了所有被比较的方法,包括其早期版本。

基准测试

基准方法指标
cover-song-identification-on-da-tacosByteCover3
mAP: 0.703
cover-song-identification-on-shs100k-testByteCover3
mAP: 0.8242

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ByteCover3:基于短查询的精确翻唱歌曲识别 | 论文 | HyperAI超神经