
摘要
自动合成规划的核心挑战在于能够生成并预测多种化学反应的结果。特别是在许多情况下,最可能的合成路径由于额外的约束条件而无法应用,这需要提出替代的化学反应方案。鉴于此,我们介绍了分子编辑图注意力网络(Molecule Edit Graph Attention Network, MEGAN),这是一种端到端的编码器-解码器神经模型。MEGAN 的设计灵感来源于将化学反应表示为一系列图编辑操作的模型,类似于箭头推动形式主义。我们将这一模型扩展到逆向合成预测(根据化学反应的产物预测底物)并将其应用于大规模数据集。我们认为,将反应表示为一系列编辑操作使得 MEGAN 能够高效地探索可能的化学反应空间,同时保持端到端建模的灵活性,并在标准基准测试中达到了最先进的准确性。代码和训练好的模型已在线提供,网址为 https://github.com/molecule-one/megan。
代码仓库
molecule-one/megan
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| single-step-retrosynthesis-on-uspto-50k | MEGAN (reaction class unknown) | Top-1 accuracy: 48.1 Top-10 accuracy: 86.1 Top-20 accuracy: 90.3 Top-3 accuracy: 70.7 Top-5 accuracy: 78.4 Top-50 accuracy: 93.2 |
| single-step-retrosynthesis-on-uspto-50k | MEGAN (reaction class as prior) | Top-1 accuracy: 60.7 Top-10 accuracy: 91.6 Top-3 accuracy: 82 Top-5 accuracy: 87.5 |