3 个月前

SemiRetro:半模板框架提升深度逆合成预测

SemiRetro:半模板框架提升深度逆合成预测

摘要

近期,基于模板(Template-Based, TB)与无模板(Template-Free, TF)的分子图学习方法在逆合成分析中展现出良好的性能。TB方法通过使用预先编码的反应模板,具有更高的预测准确性;而TF方法则通过将逆合成过程分解为中心识别与合成子补全两个子问题,具备更强的可扩展性。为兼顾TB与TF方法的优势,本文提出将完整模板拆分为多个半模板(semi-templates),并将其嵌入两阶段无模板框架中。由于大量半模板具有重复性,该策略在有效降低模板冗余的同时,仍保留了关键的化学知识,从而有助于提升合成子补全的准确性。我们将其方法命名为SemiRetro,并引入一种新型图神经网络层(DRGAT)以增强中心原子的识别能力,同时设计了一种新颖的自校正模块,用于提升半模板分类的性能。实验结果表明,SemiRetro在各项指标上显著优于现有的TB与TF方法。在可扩展性方面,SemiRetro仅使用150个半模板即可覆盖98.9%的数据,而此前基于模板的GLN方法需使用11,647个模板才能覆盖93.3%的数据。在Top-1准确率上,SemiRetro相较于无模板方法G2G分别提升4.8%(已知类别)和6.0%(未知类别)。此外,SemiRetro在训练效率方面也优于现有方法,展现出更优的实用潜力。

基准测试

基准方法指标
single-step-retrosynthesis-on-uspto-50kSemiRetro (reaction class unknown)
Top-1 accuracy: 54.9
Top-10 accuracy: 84.1
Top-3 accuracy: 75.3
Top-5 accuracy: 80.4
single-step-retrosynthesis-on-uspto-50kSemiRetro (reaction class as prior)
Top-1 accuracy: 65.8
Top-10 accuracy: 92.8
Top-3 accuracy: 85.7
Top-5 accuracy: 89.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SemiRetro:半模板框架提升深度逆合成预测 | 论文 | HyperAI超神经