{Gerhard WeikumStefan ThaterBilyana TanevaMarc SpaniolManfred PinkalHagen FürstenauIlaria BordinoMohamed Amir YosefJohannes Hoffart}

摘要
在自然语言文本中消歧命名实体,是指将模糊名称的提及映射到知识库(如DBpedia或YAGO)中注册的规范实体(如人物或地点)。本文提出了一种稳健的集体消歧方法,该方法利用知识库中的上下文信息,并引入一种新型的一致性图(coherence graph)结构。该方法将以往的多种方法统一到一个综合性框架中,综合考虑三个关键指标:实体被提及的先验概率、提及上下文与候选实体上下文之间的相似性,以及所有提及所对应候选实体之间的整体一致性。该方法构建一个加权图,其中包含提及项与候选实体,进而计算出一个稠密子图,以近似最优的联合提及-实体映射结果。实验结果表明,该新方法在准确率方面显著优于以往方法,并在多种输入条件下均表现出良好的鲁棒性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| entity-disambiguation-on-aida-conll | Hoffart et al. | In-KB Accuracy: 82.29 |
| entity-linking-on-aida-conll | Hoffart et al. (2011) | Micro-F1 strong: 72.8 |