4 个月前

基于XGBoost的准确ADMET预测

基于XGBoost的准确ADMET预测

摘要

吸收、分布、代谢、排泄和毒性(ADMET)特性在药物发现中至关重要,因为它们决定了药物的有效性和安全性。在本研究中,我们应用了包括指纹和描述符在内的多种特征组合,并采用了基于树的机器学习模型——极端梯度提升(Extreme Gradient Boosting),以实现准确的ADMET预测。我们的模型在治疗数据共享平台(Therapeutics Data Commons)的ADMET基准测试组中表现出色。在22项任务中,我们的模型有18项排名第一,21项进入前三。训练好的机器学习模型已集成到ADMETboost网络服务器中,该服务器公开访问地址为https://ai-druglab.smu.edu/admet。

代码仓库

smu-tao-group/ADMET_XGBoost
官方
GitHub 中提及

基准测试

基准方法指标
molecular-property-prediction-on-bbbp-1XGBoost
ROC-AUC: 90.5
tdc-admet-benchmarking-group-on-tdcommonsXGBoost
TDC.AMES: 0.859
TDC.BBB_Martins: 0.905
TDC.Bioavailability_Ma: 0.7
TDC.CYP2C9_Inhibition_Veith: 0.877
TDC.CYP2C9_Substrate_CarbonMangels: 0.680
TDC.CYP2D6_Inhibition_Veith: 0.794
TDC.CYP2D6_Substrate_CarbonMangels: 0.387
TDC.CYP3A4_Inhibition_Veith: 0.721
TDC.CYP3A4_Substrate_CarbonMangels: 0.648
TDC.Caco2_Wang: 0.288
TDC.Clearance_Hepatocyte_AZ: 0.587
TDC.Clearance_Microsome_AZ: 0.420
TDC.DILI: 0.933
TDC.HIA_Hou: 0.987
TDC.Half_Life_Obach: 0.396
TDC.LD50_Zhu: 0.602
TDC.Lipophilicity_AstraZeneca: 0.533
TDC.PPBR_AZ: 8.251
TDC.Pgp_Broccatelli: 0.911
TDC.Solubility_AqSolDB: 0.727
TDC.VDss_Lombardo: 0.612
TDC.hERG: 0.806

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于XGBoost的准确ADMET预测 | 论文 | HyperAI超神经