4 个月前

GIT-Mol:一种结合图、图像和文本的多模态大型语言模型,用于分子科学

GIT-Mol:一种结合图、图像和文本的多模态大型语言模型,用于分子科学

摘要

大型语言模型在自然语言处理领域取得了显著进展,通过处理分子的文本表示,为分子科学领域的创新应用提供了支持。然而,大多数现有的语言模型无法捕捉具有复杂分子结构或图像的丰富信息。本文介绍了一种多模态大型语言模型——GIT-Mol,该模型集成了图、图像和文本信息。为了促进多模态分子数据的融合,我们提出了一种新的架构——GIT-Former,该架构能够将所有模态对齐到一个统一的潜在空间中。与基线模型相比,我们在属性预测方面实现了5%至10%的准确率提升,在分子生成的有效性方面提高了20.2%。借助任意模态到语言的分子翻译策略,我们的模型有望执行更多的下游任务,如化合物名称识别和化学反应预测。

代码仓库

ai-hpc-research-team/git-mol
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
drug-discovery-on-baceGIT-Mol(G+S)
AUC: 0.8108
drug-discovery-on-bbbpGIT-Mol(G+S)
AUC: 0.739
drug-discovery-on-clintoxGIT-Mol(G+S)
AUC: 0.883
drug-discovery-on-siderGIT-Mol(G+S)
AUC: 0.634
drug-discovery-on-tox21GIT-Mol(G+S)
AUC: 0.759
drug-discovery-on-toxcastGIT-Mol(G+S)
AUC: 0.668
image-captioning-on-chebi-20GIT-Mol
BLEU: 0.924
Exact: 0.461
Levenshtein: 6.575
MACCS FTS: 0.962
Morgan FTS: 0.894
RDK FTS: 0.906
Validity: 0.899
text-based-de-novo-molecule-generation-onGIT-Mol-caption
BLEU: 75.6
Exact Match: 5.1
Levenshtein: 26.315
MACCS FTS: 73.8
Morgan FTS: 51.9
RDK FTS: 58.2
Validity: 92.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
GIT-Mol:一种结合图、图像和文本的多模态大型语言模型,用于分子科学 | 论文 | HyperAI超神经