4 个月前

分子多模态基础模型:关联分子图与自然语言

分子多模态基础模型:关联分子图与自然语言

摘要

尽管人工智能(AI)在多个领域中对分子的理解取得了显著进展,现有的模型通常仅从单一分子模态中获得单一的认知能力。由于分子知识的层次非常复杂,即使是人类也会通过不同的模态,包括直观的图表和专业的文本,来辅助他们的理解。受此启发,我们提出了一种基于分子多模态的基础模型,该模型通过对比学习从分子图及其语义相关的文本数据(从已发表的科学引文索引论文中爬取)进行预训练。这一AI模型直接连接了分子图和自然语言,代表了一个关键性的尝试。重要的是,通过捕捉这两种模态的具体和互补信息,我们提出的模型能够更好地掌握分子专业知识。实验结果表明,我们的模型不仅在跨模态任务(如跨模态检索和分子描述生成)中表现出色,还提高了分子性质预测的准确性,并具备从自然语言描述生成有意义的分子图的能力。我们相信,这一模型将在生物学、化学、材料科学、环境科学和医学等多个学科领域的人工智能赋能应用中产生广泛影响。

代码仓库

ai-hpc-research-team/git-mol
pytorch
GitHub 中提及
bingsu12/momu
官方
pytorch
yangzhao1230/graphtextretrieval
pytorch
GitHub 中提及
ai-hpc-research-team/slm4mol
pytorch
GitHub 中提及

基准测试

基准方法指标
molecule-captioning-on-chebi-20MoMu+MolT5-Large
BLEU-2: 59.9
BLEU-4: 51.5
METEOR: 59.7
Text2Mol: 58.2
molecule-captioning-on-chebi-20MoMu+MolT5-Base
BLEU-2: 54.9
BLEU-4: 46.2
METEOR: 57.6
Text2Mol: 55.8
molecule-captioning-on-chebi-20MoMu+MolT5-Small
BLEU-2: 53.2
BLEU-4: 44.5
METEOR: 55.7
Text2Mol: 55.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
分子多模态基础模型:关联分子图与自然语言 | 论文 | HyperAI超神经