
摘要
分子“指纹”编码了结构信息,是化学信息学和药物发现领域中机器学习应用的主要工具。然而,指纹表示方法不可避免地强调了分子结构的某些方面而忽略了其他方面,而不是让模型根据数据做出决策。本文描述了一种用于从无向图(特别是小分子)中学习的机器学习架构——分子“图卷积”。图卷积利用了分子图的简单编码方式——原子、键、距离等——从而使模型能够更好地利用图结构中的信息。尽管图卷积在性能上并不优于所有基于指纹的方法,但它们(以及其他基于图的方法)代表了配体基虚拟筛选领域的一种新范式,并为未来的改进提供了令人兴奋的机会。
代码仓库
VEK239/StructGNN-lipophilicity
GitHub 中提及
susanzhang233/mollykill_2.0
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| drug-discovery-on-qm9 | Molecular Graph Convolutions | Error ratio: 2.59 |
| graph-regression-on-lipophilicity | Weave | RMSE: 0.715 |