8 个月前

监督式微调

Sinong Wang; Han Fang; Madian Khabsa; Hanzi Mao; Hao Ma

摘要

大型预训练语言模型（LMs）在少量样本学习方面展现了卓越的能力。然而，它们的成功很大程度上依赖于模型参数的扩展，这使得训练和部署变得极具挑战性。本文提出了一种新的方法，称为EFL，该方法可以将小型语言模型转化为更优秀的少量样本学习者。该方法的核心思想是将潜在的自然语言处理任务重新表述为蕴含任务，然后使用最少8个样例对模型进行微调。我们进一步展示了所提出的方法可以：(i) 自然地与基于无监督对比学习的数据增强方法结合；(ii) 轻松扩展到多语言少量样本学习。系统评估了18个标准自然语言处理任务的结果表明，该方法在各种现有的最先进（SOTA）少量样本学习方法基础上性能提升了12%，并且在仅有500倍于大型模型如GPT-3的规模下仍能取得具有竞争力的少量样本学习效果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

监督式微调

Sinong Wang; Han Fang; Madian Khabsa; Hanzi Mao; Hao Ma

摘要

大型预训练语言模型（LMs）在少量样本学习方面展现了卓越的能力。然而，它们的成功很大程度上依赖于模型参数的扩展，这使得训练和部署变得极具挑战性。本文提出了一种新的方法，称为EFL，该方法可以将小型语言模型转化为更优秀的少量样本学习者。该方法的核心思想是将潜在的自然语言处理任务重新表述为蕴含任务，然后使用最少8个样例对模型进行微调。我们进一步展示了所提出的方法可以：(i) 自然地与基于无监督对比学习的数据增强方法结合；(ii) 轻松扩展到多语言少量样本学习。系统评估了18个标准自然语言处理任务的结果表明，该方法在各种现有的最先进（SOTA）少量样本学习方法基础上性能提升了12%，并且在仅有500倍于大型模型如GPT-3的规模下仍能取得具有竞争力的少量样本学习效果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

作为少样本学习者的蕴含关系 | 论文 | HyperAI超神经