3 个月前

通过自进化实现高效语言模型预训练与下游适配:SuperGLUE案例研究

通过自进化实现高效语言模型预训练与下游适配:SuperGLUE案例研究

摘要

本技术报告简要介绍了我团队JDExplore Vega v2在SuperGLUE排行榜上的提交成果。SuperGLUE相较于广泛使用的通用语言理解评估基准GLUE更具挑战性,包含八个高难度的语言理解任务,涵盖问答、自然语言推理、词义消歧、共指消解以及推理等能力评估。【方法】与盲目扩大预训练语言模型(PLM)规模的做法不同,我们的目标是:1)在给定参数预算(如60亿参数)的前提下,充分挖掘输入预训练数据中的知识;2)高效地将所提取的知识迁移到下游任务中。为实现目标1),我们提出了一种面向PLM的自进化学习(self-evolution learning)方法,通过智能预测应被掩码的语义信息丰富的词元(tokens),并采用修正平滑标签(rectified smooth labels)对掩码语言建模(MLM)过程进行监督,从而提升模型对关键语义信息的捕捉能力。为实现目标2),我们引入提示迁移(prompt transfer)技术,通过将基础模型及相关下游任务的知识迁移到目标任务,显著提升低资源场景下的性能表现。【结果】根据我们的提交记录(2022年10月),在优化的预训练与微调策略支持下,我们提出的60亿参数规模的Vega方法在SuperGLUE的8项任务中取得了4项新最优成绩。2022年10月8日,该方法以平均得分91.3位居SuperGLUE排行榜首位,刷新了当时的世界领先水平。

基准测试

基准方法指标
common-sense-reasoning-on-recordVega v2 6B (fine-tuned)
EM: 93.9
F1: 94.4
common-sense-reasoning-on-recordTuring NLR v5 XXL 5.4B (fine-tuned)
EM: 95.9
F1: 96.4
coreference-resolution-on-winograd-schemaTuring NLR v5 XXL 5.4B (fine-tuned)
Accuracy: 97.3
coreference-resolution-on-winograd-schemaVega v2 6B (KD-based prompt transfer)
Accuracy: 98.6
natural-language-inference-on-commitmentbankTuring NLR v5 XXL 5.4B (fine-tuned)
Accuracy: 97.6
F1: 95.9
natural-language-inference-on-commitmentbankVega v2 6B (KD-based prompt transfer)
Accuracy: 99.2
F1: 98.6
natural-language-inference-on-rteVega v2 6B (KD-based prompt transfer)
Accuracy: 96%
natural-language-inference-on-rteTuring NLR v5 XXL 5.4B (fine-tuned)
Accuracy: 94.1%
question-answering-on-boolqVega v2 6B (fine-tuned)
Accuracy: 90.5
question-answering-on-boolqTuring NLR v5 XXL 5.4B (fine-tuned)
Accuracy: 92
question-answering-on-copaVega v2 6B (KD-based prompt transfer)
Accuracy: 99.4
question-answering-on-copaTuring NLR v5 XXL 5.4B (fine-tuned)
Accuracy: 98.2
question-answering-on-multircTuring NLR v5 XXL 5.4B (fine-tuned)
EM: 63
F1: 88.4
question-answering-on-multircVega v2 6B (fine-tuned)
EM: 62.4
F1: 88.2
word-sense-disambiguation-on-words-in-contextVega v2 6B (fine-tuned)
Accuracy: 77.4
word-sense-disambiguation-on-words-in-contextTuring NLR v5 XXL 5.4B (fine-tuned)
Accuracy: 77.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过自进化实现高效语言模型预训练与下游适配:SuperGLUE案例研究 | 论文 | HyperAI超神经