
摘要
关系抽取(Relation Extraction, RE)是众多自然语言处理应用中的关键任务。文档级关系抽取旨在从整个文档中识别实体之间的关系,由于该任务需要跨句子进行推理,并处理同一文档中表达的多重关系,因此面临诸多挑战。现有的先进文档级关系抽取模型通常利用图结构来更好地建模远距离依赖关系。本文提出了一种名为SagDRE的新模型,该模型进一步考虑并捕捉文本中原始的顺序信息。所提出的模型通过学习句子级别的有向边来捕捉文档中的信息流动方向,并利用标记级别的顺序信息来编码两个实体之间的最短路径。此外,我们设计了一种自适应边界损失(adaptive margin loss),以最大化正负样本类之间的间隔。在多个不同领域的数据集上的实验结果表明,所提出的方法具有良好的有效性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| relation-extraction-on-docred | SagDRE | F1: 62.32 Ign F1: 60.11 |