4 个月前

PACTran:用于估计预训练模型在分类任务中可迁移性的PAC-Bayesian度量

PACTran:用于估计预训练模型在分类任务中可迁移性的PAC-Bayesian度量

摘要

近年来,随着预训练模型数量的不断增加,如何为特定的下游分类任务选择最佳预训练检查点的问题逐渐受到更多关注。尽管已有一些方法被提出以解决这一选择问题(例如 LEEP、H-score),但这些方法大多依赖于缺乏学习理论支持的启发式策略。本文介绍了 PACTran,一种基于理论的预训练模型选择和迁移性测量指标系列。我们首先展示了如何在迁移学习设置下从最优 PAC-Bayesian 界推导出 PACTran 指标。然后,我们在多个视觉任务(VTAB)以及一个语言与视觉结合的任务(OKVQA)上对 PACTran 的三种具体实现进行了实证评估。结果分析表明,PACTran 相比现有的选择方法,在衡量迁移性方面更加一致和有效。

代码仓库

google-research/pactran_metrics
官方
tf
GitHub 中提及

基准测试

基准方法指标
transferability-on-classification-benchmarkPACTran
Kendall's Tau: 0.266

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PACTran:用于估计预训练模型在分类任务中可迁移性的PAC-Bayesian度量 | 论文 | HyperAI超神经