
摘要
预测小分子配体与蛋白质的结合结构——这一任务被称为分子对接——对于药物设计至关重要。近年来,将分子对接视为回归问题的深度学习方法相比传统的基于搜索的方法减少了运行时间,但在准确性方面尚未取得显著改进。我们则将分子对接框架为生成建模问题,并开发了DiffDock,这是一种在非欧几里得流形上的扩散生成模型,用于描述配体的姿态。为此,我们将该流形映射到涉及对接过程中的自由度(平移、旋转和扭转)的乘积空间,并在此空间上开发了一种高效的扩散过程。实验证明,DiffDock在PDBBind数据集上取得了38%的最高成功率(RMSD<2Å),显著优于传统对接方法(23%)和深度学习方法(20%)。此外,以往的方法无法对计算折叠结构进行对接(最大准确率10.4%),而DiffDock在这些结构上保持了显著更高的精度(21.7%)。最后,DiffDock具有快速的推理时间和高选择性准确性的置信度估计。
代码仓库
gcorso/diffdock
官方
pytorch
GitHub 中提及
chenruduan/oareactdiff
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| blind-docking-on-pdbbind | SMINA | Top-1 RMSD (%u003c2): 18.7 Top-1 RMSD (Med.): 7.1 |
| blind-docking-on-pdbbind | TANKBIND | Top-1 RMSD (Med.): 4.0 |
| blind-docking-on-pdbbind | DIFFDOCK (40) | Top-1 RMSD (%u003c2): 38.2±1.0 Top-1 RMSD (Med.): 3.30±0.11 |
| blind-docking-on-pdbbind | QVINAW | Top-1 RMSD (%u003c2): 20.9 |
| blind-docking-on-pdbbind | GNINA | Top-1 RMSD (%u003c2): 22.9 Top-1 RMSD (Med.): 7.7 |
| blind-docking-on-pdbbind | DIFFDOCK (10) | Top-1 RMSD (%u003c2): 35.0±1.4 Top-1 RMSD (Med.): 3.56±0.05 |
| blind-docking-on-pdbbind | P2RANK+SMINA | Top-1 RMSD (%u003c2): 20.4 Top-1 RMSD (Med.): 6.9 |
| blind-docking-on-pdbbind | EQUIBIND+GNINA | Top-1 RMSD (%u003c2): 28.8 |
| blind-docking-on-pdbbind | GLIDE | Top-1 RMSD (%u003c2): 21.8 Top-1 RMSD (Med.): 9.3 |
| blind-docking-on-pdbbind | P2RANK+GNINA | Top-1 RMSD (Med.): 5.5 |
| blind-docking-on-pdbbind-1 | P2RANK+SMINA | Top-1 RMSD (%u003c2): 20.4 |
| blind-docking-on-pdbbind-1 | GNINA | Top-1 RMSD (Med.): 7.7 |
| blind-docking-on-pdbbind-1 | EQUIBIND+GNINA | Top-1 RMSD (Med.): 4.9 |