8 个月前

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi

摘要

我们介绍了MusicLM，这是一种能够从文本描述（如“由失真吉他 riff 伴奏的宁静小提琴旋律”）生成高保真音乐的模型。MusicLM 将条件音乐生成过程视为分层序列到序列建模任务，并以 24 kHz 的采样率生成音乐，且在数分钟内保持一致。我们的实验表明，MusicLM 在音频质量和对文本描述的忠实度方面均优于先前的系统。此外，我们还展示了 MusicLM 可以同时基于文本和旋律进行条件生成，即将口哨声和哼唱的旋律转换为文本标题中描述的风格。为了支持未来的研究，我们公开发布了 MusicCaps 数据集，该数据集包含 5.5 万个音乐-文本对，其中丰富的文本描述由人类专家提供。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi

摘要

我们介绍了MusicLM，这是一种能够从文本描述（如“由失真吉他 riff 伴奏的宁静小提琴旋律”）生成高保真音乐的模型。MusicLM 将条件音乐生成过程视为分层序列到序列建模任务，并以 24 kHz 的采样率生成音乐，且在数分钟内保持一致。我们的实验表明，MusicLM 在音频质量和对文本描述的忠实度方面均优于先前的系统。此外，我们还展示了 MusicLM 可以同时基于文本和旋律进行条件生成，即将口哨声和哼唱的旋律转换为文本标题中描述的风格。为了支持未来的研究，我们公开发布了 MusicCaps 数据集，该数据集包含 5.5 万个音乐-文本对，其中丰富的文本描述由人类专家提供。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

MusicLM：从文本生成音乐 | 论文 | HyperAI超神经

Command Palette

MusicLM：从文本生成音乐

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi3 more

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MusicLM：从文本生成音乐

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi3 more

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MusicLM：从文本生成音乐

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi3 more

摘要

用 AI 构建 AI

HyperAI Newsletters

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi

Andrea Agostinelli Timo I. Denk Zalán Borsos Jesse Engel Mauro Verzetti Antoine Caillon Qingqing Huang Aren Jansen Adam Roberts Marco Tagliasacchi