3 个月前

自 paced 集成学习在语音与音频分类中的应用

自 paced 集成学习在语音与音频分类中的应用

摘要

将多个机器学习模型组合成集成学习(ensemble)已被证实能够显著优于构成该集成的各个独立模型。其原因在于,不同模型之间可以相互补充,从而做出更优的决策。与传统的简单模型组合方式不同,本文提出一种自 paced 集成学习(Self-Paced Ensemble Learning, SPEL)框架,其中各模型在多个迭代过程中相互学习。在基于伪标签(pseudo-labeling)的自 paced 学习过程中,除了提升各个模型自身的性能外,该集成系统还能逐步获取目标域的知识。为验证所提 SPEL 方法的通用性,我们在三个音频处理任务上进行了实验。实验结果表明,SPEL 显著优于传统的基准集成模型。此外,我们还发现,仅对单个模型应用自 paced 学习的效果较差,这进一步说明:在集成框架中,模型之间确实存在相互学习和知识共享的机制。

基准测试

基准方法指标
speech-emotion-recognition-on-crema-dResNet-18 + SPEL
Accuracy: 68.12

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
自 paced 集成学习在语音与音频分类中的应用 | 论文 | HyperAI超神经