3 个月前

任务指南:基于任务前缀的多任务预训练扩展

任务指南:基于任务前缀的多任务预训练扩展

摘要

利用任务感知的标注数据作为监督信号,以辅助大规模无标注数据上的自监督学习,已成为预训练语言模型领域的新趋势。现有研究显示,基于大规模监督任务的多任务学习容易引发任务间的负面干扰。为应对这一挑战,我们提出了一种基于任务前缀引导的多任务预训练框架,旨在探索不同任务之间的内在关联。我们在40个数据集上开展了大量实验,结果表明,该模型不仅可作为广泛任务的强健基础主干网络,还可作为分析任务关系的探针工具。由任务前缀所反映的任务关系与任务间的迁移学习性能高度一致,同时为通过互补任务进行数据增强提供了有效方向,助力模型在常识推理排行榜上达到人类水平的性能表现。代码已开源,地址为:https://github.com/cooelf/CompassMTL。

代码仓库

cooelf/compassmtl
官方
tf
GitHub 中提及

基准测试

基准方法指标
common-sense-reasoning-on-winograndeCompassMTL 567M with Tailor
Accuracy: 90.5
common-sense-reasoning-on-winograndeCompassMTL 567M
Accuracy: 89.6
common-sense-reasoning-on-winograndeExDeBERTa 567M
Accuracy: 87
question-answering-on-piqaExDeBERTa 567M
Accuracy: 85.5
question-answering-on-piqaCompassMTL 567M
Accuracy: 87.3
question-answering-on-piqaCompassMTL 567M with Tailor
Accuracy: 88.3
question-answering-on-social-iqaCompassMTL 567M with Tailor
Accuracy: 82.2
question-answering-on-social-iqaExDeBERTa 567M
Accuracy: 79.6
question-answering-on-social-iqaCompassMTL 567M
Accuracy: 81.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
任务指南:基于任务前缀的多任务预训练扩展 | 论文 | HyperAI超神经