
摘要
文档级关系抽取旨在从文档内部提取实体之间的关系。与句子级关系抽取不同,该任务需要在文档跨多个句子的上下文中进行推理。本文提出了一种名为图聚合与推理网络(Graph Aggregation-and-Inference Network, GAIN)的新模型,其核心特征是采用双图结构。GAIN 首先构建一个异构的提及级图(heterogeneous mention-level graph, hMG),用于建模文档中不同提及之间的复杂交互关系;同时构建一个实体级图(entity-level graph, EG),并基于该图提出一种新颖的路径推理机制,用于推断实体之间的关系。在公开数据集 DocRED 上的实验表明,GAIN 相较于此前的最先进方法,在 F1 分数上取得了显著提升,提升幅度达 2.85。相关代码已开源,地址为:https://github.com/DreamInvoker/GAIN。
代码仓库
DreamInvoker/GAIN
官方
pytorch
GitHub 中提及
pkunlp-icler/gain
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| relation-extraction-on-docred | GAIN-GloVe | F1: 55.08 Ign F1: 52.66 |
| relation-extraction-on-docred | GAIN-BERT-large | F1: 62.76 Ign F1: 60.31 |
| relation-extraction-on-docred | GAIN-BERT | F1: 61.24 Ign F1: 59.00 |