4 个月前

使用无分类器引导保持主题一致性

使用无分类器引导保持主题一致性

摘要

无分类器引导(Classifier-Free Guidance, CFG)最近在文本到图像生成中作为一种轻量级技术出现,旨在促进生成过程中对提示的遵循。在这项工作中,我们展示了CFG可以广泛应用于纯语言模型中的推理阶段。我们的研究表明,CFG(1)提高了Pythia、GPT-2和LLaMA系列模型在多种任务上的性能,包括问答、推理、代码生成和机器翻译,并且在LAMBADA数据集上,使用7B参数的LLaMA模型超过了540B参数的PaLM模型;(2)带来的性能提升相当于参数量翻倍的模型;(3)可以与其他推理时间方法如思维链和自一致性结合使用,从而在困难任务中进一步提高性能;(4)可以在具有挑战性的表单驱动和内容驱动提示中提高助手的一致性和连贯性:在人类评估中,我们显示了使用CFG的GPT4All相比基线模型有75%的偏好度。

基准测试

基准方法指标
common-sense-reasoning-on-arc-easyLLaMA 13B + CFG (0-shot)
Accuracy: 79.1
common-sense-reasoning-on-arc-easyLLaMA 65B + CFG (0-shot)
Accuracy: 84.2
common-sense-reasoning-on-arc-easyLLaMA 30B + CFG (0-shot)
Accuracy: 83.2
common-sense-reasoning-on-arc-easyLLaMA 7B + CFG (0-shot)
Accuracy: 58.9
language-modelling-on-lambadaLLaMA-30B+CFG (zero-shot)
Accuracy: 83.9
language-modelling-on-lambadaLLaMA-13B+CFG (zero-shot)
Accuracy: 82.2
language-modelling-on-lambadaLLaMA-65B+CFG (Zero-Shot)
Accuracy: 84.0
text-generation-on-sciqLLaMA-13B+CFG (zero-shot)
Accuracy: 95.1
text-generation-on-sciqLLaMA-30B+CFG (zero-shot)
Accuracy: 96.4
text-generation-on-sciqLLaMA-65B+CFG (zero-shot)
Accuracy: 96.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用无分类器引导保持主题一致性 | 论文 | HyperAI超神经