3 个月前

TransformerCPI:通过基于序列的深度学习结合自注意力机制与标签反转实验提升化合物-蛋白质相互作用预测

TransformerCPI:通过基于序列的深度学习结合自注意力机制与标签反转实验提升化合物-蛋白质相互作用预测

摘要

动机在药物发现与化学生物组学研究中,识别化合物-蛋白相互作用(Compound-Protein Interaction, CPI)是一项关键任务。然而,大量潜在的生物靶点蛋白缺乏三维结构信息,这促使人们亟需发展仅基于蛋白序列信息进行CPI预测的方法。然而,基于序列的CPI模型可能面临一系列特定挑战,包括使用不恰当的数据集、隐含的配体偏差(ligand bias)以及数据集划分方式不合理等问题,这些因素可能导致模型预测性能被严重高估。结果为应对上述问题,我们构建了专用于CPI预测的新数据集,提出了一种新型的Transformer神经网络模型——TransformerCPI,并引入更为严格的标签反转实验(label reversal experiment),以检验模型是否真正学习到了真实的相互作用特征。实验结果表明,TransformerCPI在新构建的数据集上表现出显著提升的预测性能。此外,该模型具备可解释性,能够通过反卷积分析突出显示蛋白序列中关键的相互作用区域以及化合物分子中的重要原子位点,为后续配体结构优化提供具有实际价值的化学生物学指导。

基准测试

基准方法指标
drug-discovery-on-bindingdbTransformerCPI
AUC: 0.937
drug-discovery-on-lit-pcba-aldh1TransformerCPI
AUC: 0.694
drug-discovery-on-lit-pcba-esr1-antTransformerCPI
AUC: 0.616
drug-discovery-on-lit-pcba-kat2aTransformerCPI
AUC: 0.650
drug-discovery-on-lit-pcba-mapk1TransformerCPI
AUC: 0.683

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
TransformerCPI:通过基于序列的深度学习结合自注意力机制与标签反转实验提升化合物-蛋白质相互作用预测 | 论文 | HyperAI超神经