
摘要
在本研究中,我们介绍了ChemBFN,这是一种基于贝叶斯流网络处理离散数据的化学语言模型。我们提出了一种新的精度调度方法,以显著减少重构损失,从而提高采样质量。我们提供了证据表明,即使在使用较少的采样步骤时,我们的方法也适用于生成具有满意多样性的分子。此外,我们还采用了无分类器引导的方法进行条件生成。值得一提的是,经过生成训练后,我们的模型可以通过微调在回归和分类任务上达到最先进的性能,这为构建单一模块式的多功能模型开辟了道路。我们的模型已在https://github.com/Augus1999/bayesian-flow-network-for-chemistry 开源。
代码仓库
Augus1999/bayesian-flow-network-for-chemistry
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| molecular-property-prediction-on | ChemBFN | RMSE: 0.746 |
| molecular-property-prediction-on-bace-1 | ChemBFN | ROC-AUC: 73.56 |
| molecular-property-prediction-on-bbbp-1 | ChemBFN | ROC-AUC: 95.74 |
| molecular-property-prediction-on-clintox-1 | ChemBFN | ROC-AUC: 99.18 |
| molecular-property-prediction-on-esol | ChemBFN | RMSE: 0.884 |
| molecular-property-prediction-on-freesolv | ChemBFN | RMSE: 1.418 |
| molecular-property-prediction-on-hiv-1 | ChemBFN | ROC-AUC: 79.37 |
| molecular-property-prediction-on-hiv-dataset | ChemBFN | AUC: 0.794 |