4 个月前

MARS:一种基于基序的自回归模型用于逆合成预测

MARS:一种基于基序的自回归模型用于逆合成预测

摘要

逆合成分析是药物发现中的一个重要任务。许多现有方法将其表述为一个图生成问题。具体而言,这些方法首先识别反应中心,并据此拆分目标分子以生成合成子。反应物的生成则通过向合成子图中依次添加原子或直接添加合适的离去基团来实现。然而,这两种策略都存在不足:添加原子会导致较长的预测序列,增加生成难度;而添加离去基团只能考虑训练集中出现的基团,导致泛化能力较差。在本文中,我们提出了一种新的端到端图生成模型用于逆合成预测,该模型依次识别反应中心、生成合成子,并向合成子中添加化学有意义的片段(motifs)以生成反应物。由于化学有意义的片段比原子大但比离去基团小,我们的方法在预测复杂度上低于逐原子添加,在泛化能力上优于逐离去基团添加。在基准数据集上的实验表明,所提出的模型显著优于之前的最先进算法。

基准测试

基准方法指标
single-step-retrosynthesis-on-uspto-50kMARS (reaction class as prior)
Top-1 accuracy: 66.2
Top-10 accuracy: 92.9
Top-3 accuracy: 85.8
Top-5 accuracy: 90.2
single-step-retrosynthesis-on-uspto-50kMARS (reaction class unknown)
Top-1 accuracy: 54.6
Top-10 accuracy: 88.5
Top-3 accuracy: 76.4
Top-5 accuracy: 83.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MARS:一种基于基序的自回归模型用于逆合成预测 | 论文 | HyperAI超神经