
摘要
在这项工作中,我们提出了一种新的分段超图表示方法,用于建模在许多实际数据集中普遍存在的重叠实体提及。我们展示了基于这种新表示构建的模型能够在保持较低推理时间复杂度的同时,捕捉到先前模型无法捕捉的特征和交互。此外,我们还进行了理论分析,正式评估了我们的表示方法在表示能力方面相较于文献中报道的其他表示方法的优势。结合神经网络进行特征学习,我们的模型在三个标注有重叠提及的基准数据集上达到了最先进的性能。
代码仓库
berlino/overlapping-ner-em18
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| named-entity-recognition-on-ace-2004 | Neural segmental hypergraphs | F1: 75.1 Multi-Task Supervision: n |
| named-entity-recognition-on-ace-2005 | Neural segmental hypergraphs | F1: 74.5 |
| named-entity-recognition-on-genia | Neural segmental hypergraphs | F1: 75.1 |
| nested-mention-recognition-on-ace-2004 | Neural segmental hypergraphs | F1: 75.1 |
| nested-mention-recognition-on-ace-2005 | Neural segmental hypergraphs | F1: 74.5 |
| nested-named-entity-recognition-on-ace-2004 | Neural segmental hypergraphs | F1: 75.1 |
| nested-named-entity-recognition-on-ace-2005 | Neural segmental hypergraphs | F1: 74.5 |
| nested-named-entity-recognition-on-genia | Neural segmental hypergraphs | F1: 75.1 |
| nested-named-entity-recognition-on-nne | Neural Segmental Hypergraphs | Micro F1: 91.4 |