
摘要
生物医学互作网络在预测具有生物学意义的互作关系、识别疾病网络生物标志物以及发现潜在药物靶点方面具有巨大潜力。近年来,图神经网络(Graph Neural Networks)被提出用于有效学习生物医学实体的表示,并在生物医学互作预测任务中取得了最先进的性能。然而,现有方法通常仅考虑邻近节点的局部信息,难以捕捉来自不同距离邻居的特征的全局混合信息。为此,本文提出一种高阶图卷积网络(Higher-Order Graph Convolutional Network, HOGCN),用于聚合来自高阶邻域的信息,以提升生物医学互作预测的准确性。具体而言,HOGCN能够收集来自不同距离邻居的特征表示,并通过学习其线性组合,获得更具信息量的生物医学实体表示。在四种互作网络(包括蛋白质-蛋白质互作、药物-药物互作、药物-靶点互作以及基因-疾病互作)上的实验结果表明,HOGCN能够实现更准确且校准性更好的预测性能。尤其在噪声较大、互作关系稀疏的网络中,当综合考虑多距离邻居的特征表示时,HOGCN仍表现出优异的鲁棒性。此外,通过基于文献的案例研究,本文验证了一组新预测的互作关系,进一步证实了模型的生物学合理性与实用性。
代码仓库
kckishan/HOGCN-LP
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| link-prediction-on-drug-drug-interactions | HOGCN | AUPRC: 89.7 |
| link-prediction-on-drug-target-interactions | HOGCN | AUPRC: 93.7 |
| link-prediction-on-gene-disease-interactions | HOGCN | AUPRC: 94.1 |
| link-prediction-on-protein-protein | HOGCN | AUPRC: 93 |