3 个月前

命名实体识别在实体链接中的应用:现状与未来展望

命名实体识别在实体链接中的应用:现状与未来展望

摘要

实体链接(Entity Linking, EL)系统在标准基准测试中取得了令人瞩目的成果,这主要得益于近年来预训练语言模型所提供的上下文表征能力。然而,这类系统仍需大量标注数据——数百万个标注样本——才能达到最佳性能,且训练时间往往超过数天,尤其在计算资源有限的情况下更为显著。本文探讨了如何利用命名实体识别(Named Entity Recognition, NER)技术,缩小在高、低标注数据量下训练的EL系统之间的性能差距。具体而言,我们展示了EL系统如何以及在何种程度上借助NER来增强实体表征、优化候选实体选择、选取更具代表性的负样本,并对输出实体施加硬约束与软约束。相关代码与模型检查点已开源,可访问 https://github.com/Babelscape/ner4el 获取。

基准测试

基准方法指标
entity-disambiguation-on-ace2004NER4EL
Micro-F1: 91.3
entity-disambiguation-on-aida-conllNER4EL
In-KB Accuracy: 92.5
entity-disambiguation-on-aquaintNER4EL
Micro-F1: 69.5
entity-disambiguation-on-msnbcNER4EL
Micro-F1: 89.2
entity-disambiguation-on-wned-cwebNER4EL
Micro-F1: 68.5
entity-disambiguation-on-wned-wikiNER4EL
Micro-F1: 64.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
命名实体识别在实体链接中的应用:现状与未来展望 | 论文 | HyperAI超神经