
摘要
在本文中,我们提出了一种基于变压器语言模型的端到端联合实体和关系抽取方法。我们将该模型应用于LaTeX文档中数学符号与其描述之间的链接任务。与现有的顺序进行实体和关系抽取的方法不同,我们的系统将关系抽取的信息融入到实体抽取过程中。这意味着即使在仅标注了部分有效实体跨度的数据集上,系统也可以进行训练。我们对所提出的系统进行了详尽的评估,并分析了其优缺点。我们的方法可以在推理时动态调整计算复杂度,并在SemEval-2022第12项任务的排行榜上取得了第三名的成绩。对于物理和数学领域的输入,该方法分别达到了95.43%和79.17%的关系抽取宏F1分数。用于训练和评估我们模型的代码可在以下地址获取:https://github.com/nicpopovic/RE1st
代码仓库
nicpopovic/re1st
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| joint-entity-and-relation-extraction-on-6 | SciBERT (mean pooling / no preprocessing) | Entity F1 (partial): 41.21 Relation F1: 32.28 |