
摘要
吸收、分布、代谢、排泄和毒性(ADMET)特性在药物发现中至关重要,因为它们决定了药物的有效性和安全性。在本研究中,我们应用了包括指纹和描述符在内的多种特征组合,并采用了基于树的机器学习模型——极端梯度提升(Extreme Gradient Boosting),以实现准确的ADMET预测。我们的模型在治疗数据共享平台(Therapeutics Data Commons)的ADMET基准测试组中表现出色。在22项任务中,我们的模型有18项排名第一,21项进入前三。训练好的机器学习模型已集成到ADMETboost网络服务器中,该服务器公开访问地址为https://ai-druglab.smu.edu/admet。
代码仓库
smu-tao-group/ADMET_XGBoost
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| molecular-property-prediction-on-bbbp-1 | XGBoost | ROC-AUC: 90.5 |
| tdc-admet-benchmarking-group-on-tdcommons | XGBoost | TDC.AMES: 0.859 TDC.BBB_Martins: 0.905 TDC.Bioavailability_Ma: 0.7 TDC.CYP2C9_Inhibition_Veith: 0.877 TDC.CYP2C9_Substrate_CarbonMangels: 0.680 TDC.CYP2D6_Inhibition_Veith: 0.794 TDC.CYP2D6_Substrate_CarbonMangels: 0.387 TDC.CYP3A4_Inhibition_Veith: 0.721 TDC.CYP3A4_Substrate_CarbonMangels: 0.648 TDC.Caco2_Wang: 0.288 TDC.Clearance_Hepatocyte_AZ: 0.587 TDC.Clearance_Microsome_AZ: 0.420 TDC.DILI: 0.933 TDC.HIA_Hou: 0.987 TDC.Half_Life_Obach: 0.396 TDC.LD50_Zhu: 0.602 TDC.Lipophilicity_AstraZeneca: 0.533 TDC.PPBR_AZ: 8.251 TDC.Pgp_Broccatelli: 0.911 TDC.Solubility_AqSolDB: 0.727 TDC.VDss_Lombardo: 0.612 TDC.hERG: 0.806 |