
摘要
近期神经语言模型的进展已成功应用于化学领域,为分子设计和合成规划中的经典问题提供了生成解决方案。这些新方法有望推动科学发现进入数据驱动自动化的新时代。然而,每项任务通常仍需要专门的模型,导致了针对特定问题的微调需求,并忽视了任务之间的关联性。该领域的主要障碍在于自然语言和化学表示之间缺乏统一的表示形式,这不仅复杂化了人机交互,也限制了其发展。在此,我们提出了一种首个多领域、多任务的语言模型,能够解决化学和自然语言领域中广泛的任务。我们的模型可以同时处理化学和自然语言信息,而无需在单一领域进行昂贵的预训练或使用特定任务的模型。有趣的是,跨领域的权重共享显著提高了我们在单域和跨域基准测试中的表现。特别是,在跨域任务中,通过跨领域和跨任务的信息共享实现了显著改进,其改进幅度随着规模的增加而增大,这一点通过十多个相关指标得到了验证。我们的研究结果表明,这类模型可以通过取代特定问题的微调并增强人机交互来稳健且高效地加速物理科学领域的发现进程。
代码仓库
gt4sd/multitask_text_and_chemistry_t5
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| molecule-captioning-on-chebi-20 | Text+Chem T5-augm-Base | BLEU-2: 62.5 BLEU-4: 54.2 METEOR: 64.8 ROUGE-1: 68.2 ROUGE-2: 54.3 ROUGE-L: 62.2 |
| molecule-captioning-on-chebi-20 | Text+Chem T5-augm-Small | BLEU-2: 56.0 BLEU-4: 47.0 METEOR: 58.8 ROUGE-1: 63.8 ROUGE-2: 48.8 ROUGE-L: 58 |
| molecule-captioning-on-chebi-20 | Text+Chem T5-Base | BLEU-2: 58 BLEU-4: 49 METEOR: 60.4 ROUGE-1: 64.7 ROUGE-2: 49.8 ROUGE-L: 58.6 |
| molecule-captioning-on-chebi-20 | Text+Chem T5-Small | BLEU-2: 55.3 BLEU-4: 46.2 METEOR: 58.3 ROUGE-1: 63.3 ROUGE-2: 48.1 ROUGE-L: 57.4 |
| text-based-de-novo-molecule-generation-on | Text+Chem T5 base | BLEU: 75 Exact Match: 21.2 Frechet ChemNet Distance (FCD): 0.061 Levenshtein: 27.39 MACCS FTS: 87.4 Morgan FTS: 69.7 Parameter Count: 220000000 RDK FTS: 76.7 Validity: 79.2 |
| text-based-de-novo-molecule-generation-on | Text+Chem T5 small | BLEU: 73.9 Exact Match: 15.7 Frechet ChemNet Distance (FCD): 0.066 Levenshtein: 28.54 MACCS FTS: 85.9 Morgan FTS: 66 Parameter Count: 60000000 RDK FTS: 73.6 Validity: 77.6 |
| text-based-de-novo-molecule-generation-on | Text+Chem T5-augm small | BLEU: 81.5 Exact Match: 19.1 Frechet ChemNet Distance (FCD): 0.06 Levenshtein: 21.78 MACCS FTS: 86.4 Morgan FTS: 67.2 Parameter Count: 60000000 RDK FTS: 74.4 Validity: 95.1 |
| text-based-de-novo-molecule-generation-on | Text+Chem T5-augm base | BLEU: 85.3 Exact Match: 32.2 Frechet ChemNet Distance (FCD): .05 Levenshtein: 16.87 MACCS FTS: 90.1 Morgan FTS: 75.7 Parameter Count: 220000000 RDK FTS: 81.6 Validity: 94.3 |