4 个月前

图神经网络的预训练策略

图神经网络的预训练策略

摘要

许多机器学习应用需要模型在测试样本上做出准确预测,而这些测试样本的分布与训练样本不同,同时在训练过程中特定任务的标签数据非常稀缺。应对这一挑战的有效方法是在数据丰富的相关任务上预训练模型,然后在感兴趣的下游任务上进行微调。尽管预训练已在许多语言和视觉领域取得了显著效果,但在图数据集上如何有效利用预训练仍然是一个开放问题。本文中,我们开发了一种新的策略和自监督方法来预训练图神经网络(GNNs)。该策略成功的关键在于在单个节点和整个图的层面上预训练一个具有高表达能力的GNN,从而使GNN能够同时学习有用的局部和全局表示。我们系统地研究了多个图分类数据集上的预训练方法。研究发现,仅在单个节点或整个图层面上进行预训练的简单策略只能带来有限的改进,甚至在许多下游任务上导致负迁移。相比之下,我们的策略避免了负迁移,并显著提高了下游任务的泛化性能,在ROC-AUC指标上比未预训练的模型绝对提升了高达9.4%,并在分子性质预测和蛋白质功能预测方面达到了最先进的性能。

代码仓库

microsoft/fs-mol
pytorch
GitHub 中提及
jacquesboitreaud/rna_ne
pytorch
GitHub 中提及
snap-stanford/pretrain-gnns/
官方
pytorch
GitHub 中提及
hld67890/prml2020_pj
pytorch
GitHub 中提及
maplightrx/maplight-tdc
GitHub 中提及
Wenlin-Chen/ADKF-IFT
pytorch
GitHub 中提及
jacquesboitreaud/DeepFRED
pytorch
GitHub 中提及
fransou/is-meta-learning-necessary
pytorch
GitHub 中提及
gnn4dr/DRKG
pytorch
GitHub 中提及
snap-stanford/pretrain-gnns
pytorch
GitHub 中提及

基准测试

基准方法指标
drug-discovery-on-baceContextPred
AUC: 0.845
drug-discovery-on-bbbpContextPred
AUC: 0.687
drug-discovery-on-clintoxContextPred
AUC: 0.726
drug-discovery-on-hiv-datasetContextPred
AUC: 0.799
drug-discovery-on-muvContextPred
AUC: 0.813
drug-discovery-on-siderContextPred
AUC: 0.627
drug-discovery-on-tox21ContextPred
AUC: 0.781
drug-discovery-on-toxcastContextPred
AUC: 0.657
molecular-property-prediction-onPretrainGNN
RMSE: 0.739
molecular-property-prediction-on-bace-1PretrainGNN
ROC-AUC: 84.5
molecular-property-prediction-on-bbbp-1PretrainGNN
ROC-AUC: 68.7
molecular-property-prediction-on-clintox-1PretrainGNN
ROC-AUC: 72.6
molecular-property-prediction-on-freesolvPretrainGNN
RMSE: 2.764
molecular-property-prediction-on-qm7PretrainGNN
MAE: 113.2
molecular-property-prediction-on-qm8PretrainGNN
MAE: 0.0200
molecular-property-prediction-on-qm9PretrainGNN
MAE: 0.00922
molecular-property-prediction-on-sider-1PretrainGNN
ROC-AUC: 62.7
molecular-property-prediction-on-tox21-1PretrainGNN
ROC-AUC: 78.1
molecular-property-prediction-on-toxcast-1PretrainGNN
ROC-AUC: 65.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
图神经网络的预训练策略 | 论文 | HyperAI超神经