
摘要
我们提出了rLLM(relationLLM),这是一个基于PyTorch的开源库,专为基于大语言模型(LLMs)的关联表学习(Relational Table Learning, RTL)任务而设计。其核心思想是将当前最先进的图神经网络(GNNs)、大语言模型(LLMs)以及表格神经网络分解为标准化模块,从而支持以简洁的“组合、对齐与联合训练”(combine, align, and co-train)方式,快速构建新型RTL模型。为展示rLLM的使用方法,我们提出了一种简明的RTL方法——\textbf{BRIDGE}。此外,我们通过对经典数据集进行增强,构建了三个全新的关系型表格数据集:TML1M、TLF2K和TACM12K。我们期望rLLM能够成为RTL相关任务中一个实用且易于使用的开发框架。项目代码已开源,访问地址为:https://github.com/rllm-project/rllm。
代码仓库
rllm-project/rllm
pytorch
GitHub 中提及
rllm-project/rllm_datasets
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| classification-on-tacm12k | BRIDGE | Accuracy: 25.6 |
| classification-on-tlf2k | BRIDGE | Accuracy: 42.2 |
| classification-on-tml1m | BRIDGE | Accuracy: 36.2 |