
摘要
实体链接是研究中一个重要的方向,主要集中在通过将文本片段链接到本体或知识源来创建结构化数据。我们重新审视了用于实体链接的结构化预测方法,该方法对每个单独的输入标记进行分类,并汇总这些标记的预测结果。我们的系统称为SpEL(Structured prediction for Entity Linking),是一种最先进的实体链接系统,它引入了一些新的思想来将结构化预测应用于实体链接任务,包括:两个改进的微调步骤;一种上下文敏感的预测聚合策略;减少模型输出词汇表的大小;以及解决实体链接系统中常见的训练与推理标记化不匹配问题。实验结果表明,我们在常用的AIDA基准数据集上对维基百科的实体链接性能超过了现有最先进水平。此外,我们的方法在参数数量和推理速度方面也非常高效。
代码仓库
shavarani/spel
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| entity-linking-on-aida-conll | SpEL-base (2023) | Micro-F1 strong: 88.1 |
| entity-linking-on-aida-conll | SpEL-large (2023) | Micro-F1 strong: 88.6 |
| entity-linking-on-aida-testc | SpEL-large (2023) | Micro-F1 strong: 77.5 |
| entity-linking-on-aida-testc | SpEL-base (2023) | Micro-F1 strong: 73.7 |