4 个月前

通过多任务语言模型统一分子和文本表示

通过多任务语言模型统一分子和文本表示

摘要

近期神经语言模型的进展已成功应用于化学领域,为分子设计和合成规划中的经典问题提供了生成解决方案。这些新方法有望推动科学发现进入数据驱动自动化的新时代。然而,每项任务通常仍需要专门的模型,导致了针对特定问题的微调需求,并忽视了任务之间的关联性。该领域的主要障碍在于自然语言和化学表示之间缺乏统一的表示形式,这不仅复杂化了人机交互,也限制了其发展。在此,我们提出了一种首个多领域、多任务的语言模型,能够解决化学和自然语言领域中广泛的任务。我们的模型可以同时处理化学和自然语言信息,而无需在单一领域进行昂贵的预训练或使用特定任务的模型。有趣的是,跨领域的权重共享显著提高了我们在单域和跨域基准测试中的表现。特别是,在跨域任务中,通过跨领域和跨任务的信息共享实现了显著改进,其改进幅度随着规模的增加而增大,这一点通过十多个相关指标得到了验证。我们的研究结果表明,这类模型可以通过取代特定问题的微调并增强人机交互来稳健且高效地加速物理科学领域的发现进程。

代码仓库

gt4sd/multitask_text_and_chemistry_t5
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
molecule-captioning-on-chebi-20Text+Chem T5-augm-Base
BLEU-2: 62.5
BLEU-4: 54.2
METEOR: 64.8
ROUGE-1: 68.2
ROUGE-2: 54.3
ROUGE-L: 62.2
molecule-captioning-on-chebi-20Text+Chem T5-augm-Small
BLEU-2: 56.0
BLEU-4: 47.0
METEOR: 58.8
ROUGE-1: 63.8
ROUGE-2: 48.8
ROUGE-L: 58
molecule-captioning-on-chebi-20Text+Chem T5-Base
BLEU-2: 58
BLEU-4: 49
METEOR: 60.4
ROUGE-1: 64.7
ROUGE-2: 49.8
ROUGE-L: 58.6
molecule-captioning-on-chebi-20Text+Chem T5-Small
BLEU-2: 55.3
BLEU-4: 46.2
METEOR: 58.3
ROUGE-1: 63.3
ROUGE-2: 48.1
ROUGE-L: 57.4
text-based-de-novo-molecule-generation-onText+Chem T5 base
BLEU: 75
Exact Match: 21.2
Frechet ChemNet Distance (FCD): 0.061
Levenshtein: 27.39
MACCS FTS: 87.4
Morgan FTS: 69.7
Parameter Count: 220000000
RDK FTS: 76.7
Validity: 79.2
text-based-de-novo-molecule-generation-onText+Chem T5 small
BLEU: 73.9
Exact Match: 15.7
Frechet ChemNet Distance (FCD): 0.066
Levenshtein: 28.54
MACCS FTS: 85.9
Morgan FTS: 66
Parameter Count: 60000000
RDK FTS: 73.6
Validity: 77.6
text-based-de-novo-molecule-generation-onText+Chem T5-augm small
BLEU: 81.5
Exact Match: 19.1
Frechet ChemNet Distance (FCD): 0.06
Levenshtein: 21.78
MACCS FTS: 86.4
Morgan FTS: 67.2
Parameter Count: 60000000
RDK FTS: 74.4
Validity: 95.1
text-based-de-novo-molecule-generation-onText+Chem T5-augm base
BLEU: 85.3
Exact Match: 32.2
Frechet ChemNet Distance (FCD): .05
Levenshtein: 16.87
MACCS FTS: 90.1
Morgan FTS: 75.7
Parameter Count: 220000000
RDK FTS: 81.6
Validity: 94.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
通过多任务语言模型统一分子和文本表示 | 论文 | HyperAI超神经