8 个月前

音频和语音处理

多任务学习

Calum Heggan Sam Budgett Timothy Hospedales Mehrdad Yaghoobi

摘要

目前可用的少样本学习（基于少量训练样本的机器学习）基准测试在涵盖的领域上存在局限性，主要集中在图像分类。本研究旨在通过提供首个全面、公开且完全可复现的音频基准测试来缓解对图像基准测试的依赖，该基准测试覆盖了多种声音领域和实验设置。我们比较了多种技术在七个音频数据集上的少样本分类性能（这些数据集涵盖了从环境声音到人类语音的各种类型）。在此基础上，我们对联合训练（即所有数据集均用于训练过程）和跨数据集适应协议进行了深入分析，证明了通用音频少样本分类算法的可能性。我们的实验结果表明，基于梯度的元学习方法如MAML和Meta-Curvature在性能上始终优于度量方法和基线方法。此外，我们还展示了联合训练程序有助于提高所包含的环境声音数据库的整体泛化能力，并且在一定程度上也是解决跨数据集/领域问题的有效方法。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

音频和语音处理

多任务学习

Calum Heggan Sam Budgett Timothy Hospedales Mehrdad Yaghoobi

摘要

目前可用的少样本学习（基于少量训练样本的机器学习）基准测试在涵盖的领域上存在局限性，主要集中在图像分类。本研究旨在通过提供首个全面、公开且完全可复现的音频基准测试来缓解对图像基准测试的依赖，该基准测试覆盖了多种声音领域和实验设置。我们比较了多种技术在七个音频数据集上的少样本分类性能（这些数据集涵盖了从环境声音到人类语音的各种类型）。在此基础上，我们对联合训练（即所有数据集均用于训练过程）和跨数据集适应协议进行了深入分析，证明了通用音频少样本分类算法的可能性。我们的实验结果表明，基于梯度的元学习方法如MAML和Meta-Curvature在性能上始终优于度量方法和基线方法。此外，我们还展示了联合训练程序有助于提高所包含的环境声音数据库的整体泛化能力，并且在一定程度上也是解决跨数据集/领域问题的有效方法。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供