4 个月前

LDMol:一种具有结构信息潜在空间的文本到分子扩散模型超越了自回归模型

LDMol:一种具有结构信息潜在空间的文本到分子扩散模型超越了自回归模型

摘要

随着扩散模型作为前沿生成模型的出现,许多研究人员提出了基于条件扩散模型的分子生成技术。然而,分子不可避免的离散性使得扩散模型难以将原始数据与像自然语言这样高度复杂的条件连接起来。为了解决这一问题,本文提出了一种新颖的潜在扩散模型——LDMol,用于文本条件下的分子生成。通过认识到合适的潜在空间设计是扩散模型性能的关键,我们采用了对比学习策略从文本数据中提取出新的特征空间,该特征空间嵌入了分子结构的独特特性。实验结果表明,LDMol在文本到分子生成基准测试中优于现有的自回归基线模型,成为首批在文本数据生成方面超越自回归模型的扩散模型之一,这得益于其对潜在域的更好选择。此外,我们还展示了LDMol可以应用于下游任务,如分子到文本检索和文本引导的分子编辑,证明了其作为扩散模型的多功能性。

代码仓库

jinhojsk515/ldmol
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
text-based-de-novo-molecule-generation-onLDMol
BLEU: 92.6
Exact Match: 53.3
Frechet ChemNet Distance (FCD): 0.20
Levenshtein: 6.750
MACCS FTS: 97.3
Morgan FTS: 93.1
RDK FTS: 95.0
Validity: 94.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
LDMol:一种具有结构信息潜在空间的文本到分子扩散模型超越了自回归模型 | 论文 | HyperAI超神经