
摘要
逆合成分析的主要目标是递归地将所需分子分解为可用的构建模块。现有的基于模板的逆合成方法遵循一种模板选择模式,但由于训练模板数量有限,这限制了它们发现新反应的能力。为了克服这一局限性,我们提出了一种创新的逆合成预测框架,该框架能够组成超出训练模板范围的新模板。据我们所知,这是首个利用机器学习组成逆合成预测反应模板的方法。此外,我们还提出了一种有效的反应物候选评分模型,该模型能够捕捉原子级别的转化过程,从而帮助我们的方法在USPTO-50K数据集上的表现优于先前的方法。实验结果表明,我们的方法可以为15个USPTO-50K测试反应生成新的模板,而这些反应未被训练模板覆盖。我们已发布了源代码实现。
代码仓库
uta-smile/retrocomposer
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| single-step-retrosynthesis-on-uspto-50k | RetroComposer (reaction class as prior) | Top-1 accuracy: 65.9 Top-10 accuracy: 91.5 Top-3 accuracy: 85.8 Top-5 accuracy: 89.5 |
| single-step-retrosynthesis-on-uspto-50k | RetroComposer (reaction class unknown) | Top-1 accuracy: 54.4 Top-10 accuracy: 87.7 Top-3 accuracy: 77.2 Top-5 accuracy: 83.2 |