3 个月前

文本中命名实体的鲁棒消歧

文本中命名实体的鲁棒消歧

摘要

在自然语言文本中消歧命名实体,是指将模糊名称的提及映射到知识库(如DBpedia或YAGO)中注册的规范实体(如人物或地点)。本文提出了一种稳健的集体消歧方法,该方法利用知识库中的上下文信息,并引入一种新型的一致性图(coherence graph)结构。该方法将以往的多种方法统一到一个综合性框架中,综合考虑三个关键指标:实体被提及的先验概率、提及上下文与候选实体上下文之间的相似性,以及所有提及所对应候选实体之间的整体一致性。该方法构建一个加权图,其中包含提及项与候选实体,进而计算出一个稠密子图,以近似最优的联合提及-实体映射结果。实验结果表明,该新方法在准确率方面显著优于以往方法,并在多种输入条件下均表现出良好的鲁棒性。

基准测试

基准方法指标
entity-disambiguation-on-aida-conllHoffart et al.
In-KB Accuracy: 82.29
entity-linking-on-aida-conllHoffart et al. (2011)
Micro-F1 strong: 72.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
文本中命名实体的鲁棒消歧 | 论文 | HyperAI超神经