
摘要
我们提出了一种通用框架,用于多个信息抽取任务,这些任务通过动态构建的跨度图共享跨度表示。图的构建方法是选择最可信的实体跨度,并通过置信度加权的关系类型和共指链接这些节点。动态跨度图允许共指和关系类型的置信度在图中传播,从而迭代地优化跨度表示。这与以往的信息抽取多任务框架不同,在以往的框架中,任务之间的唯一交互是在共享的第一层LSTM(长短期记忆网络)中进行的。我们的框架在多个数据集上显著超越了现有最佳方法,这些数据集反映了不同的领域。此外,我们观察到跨度枚举方法在检测嵌套实体跨度方面表现出色,在ACE(Automatic Content Extraction)数据集上的F1分数有显著提升。
代码仓库
AndrewSukhobok95/DL_GraphEntity_project
pytorch
GitHub 中提及
tricktreat/trimf
pytorch
GitHub 中提及
luanyi/DyGIE
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| joint-entity-and-relation-extraction-on | DyGIE | Cross Sentence: Yes Entity F1: 65.2 Relation F1: 41.6 |
| named-entity-recognition-on-wlpc | DyGIE | F1: 79.5 |
| relation-extraction-on-ace-2004 | DyGIE | Cross Sentence: Yes NER Micro F1: 87.4 RE Micro F1: 59.7 |
| relation-extraction-on-ace-2005 | DyGIE | Cross Sentence: Yes NER Micro F1: 88.4 RE Micro F1: 63.2 Sentence Encoder: ELMo |
| relation-extraction-on-wlpc | DyGIE | F1: 64.1 |