
摘要
近期在实体消歧(Entity Disambiguation, ED)领域的研究通常忽略了结构化知识库(Knowledge Base, KB)中的事实,而是依赖于知识库中的一小部分信息,如实体描述或类型。这限制了实体可以在其中进行消歧的上下文范围。为了利用所有知识库事实,以及描述和类型,我们提出了一种通过完全可微分的方式在符号知识库上进行推理的ED模型。该模型在六个知名的ED数据集上平均超越了现有的最先进基线方法1.3个F1分数。通过允许访问所有知识库信息,我们的模型减少了对基于流行度的实体先验的依赖,并在具有挑战性的ShadowLink数据集(强调不常见和模糊实体)上提高了12.7个F1分数的表现。
代码仓库
amazon-science/ReFinED
pytorch
GitHub 中提及
alexa/refined
pytorch
GitHub 中提及
amazon-research/ReFinED
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| entity-disambiguation-on-ace2004 | KBED | Micro-F1: 93.4 |
| entity-disambiguation-on-aida-conll | KBED | In-KB Accuracy: 90.4 |
| entity-disambiguation-on-aquaint | KBED | Micro-F1: 92.6 |
| entity-disambiguation-on-msnbc | KBED | Micro-F1: 94.8 |
| entity-disambiguation-on-shadowlink-shadow | KBED | Micro-F1: 47.6 |
| entity-disambiguation-on-shadowlink-top | KBED | Micro-F1: 64.2 |
| entity-disambiguation-on-wned-cweb | KBED | Micro-F1: 78.2 |
| entity-disambiguation-on-wned-wiki | KBED | Micro-F1: 90.4 |