
摘要
神经网络技术的进步已经导致了分子性质预测算法解决方案的广泛发展。特别是两类模型取得了令人鼓舞的结果:一类是应用于计算出的分子指纹或专家设计的描述符的神经网络,另一类是在分子图结构上操作以构建学习到的分子表示的图卷积神经网络。然而,最近的研究尚未明确哪种方法在推广到新的化学空间时更为优越。此外,先前的研究很少在工业研究环境中将这些新模型与现有的已应用模型进行对比分析。本文中,我们在涵盖多种化学终点的19个公共数据集和16个专有工业数据集上对模型进行了广泛的基准测试。此外,我们引入了一种图卷积模型,该模型在公共和专有数据集上始终匹配或超越使用固定分子描述符以及先前图神经架构的模型。我们的实证结果表明,尽管基于这些表示的方法尚未达到实验可重复性的水平,但所提出的模型仍然为工业工作流程中当前使用的模型提供了显著改进。
代码仓库
swansonk14/chemprop
官方
pytorch
GitHub 中提及
jbr-ai-labs/lipophilicity-prediction
pytorch
GitHub 中提及
tingweidaniel/chemprop_atomicfp_save_depth_final
pytorch
GitHub 中提及
anonymous20201002/chemprop
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| molecular-property-prediction-on | D-MPNN | RMSE: 0.683 |
| molecular-property-prediction-on-bace-1 | D-MPNN | ROC-AUC: 80.9 |
| molecular-property-prediction-on-bbbp-1 | D-MPNN | ROC-AUC: 71.0 |
| molecular-property-prediction-on-clintox-1 | D-MPNN | ROC-AUC: 90.6 |
| molecular-property-prediction-on-esol | D-MPNN | RMSE: 1.050 |
| molecular-property-prediction-on-freesolv | D-MPNN | RMSE: 2.082 |
| molecular-property-prediction-on-qm7 | D-MPNN | MAE: 103.5 |
| molecular-property-prediction-on-qm8 | D-MPNN | MAE: 0.0190 |
| molecular-property-prediction-on-qm9 | D-MPNN | MAE: 0.00814 |
| molecular-property-prediction-on-sider-1 | D-MPNN | ROC-AUC: 57.0 |
| molecular-property-prediction-on-tox21-1 | D-MPNN | ROC-AUC: 75.9 |
| molecular-property-prediction-on-toxcast-1 | D-MPNN | ROC-AUC: 65.5 |