4 个月前

文档级实体抽取作为模板生成

文档级实体抽取作为模板生成

摘要

文档级实体抽取(Document-level Entity Extraction, EE)旨在从文本语料库中提取以实体为中心的信息,如实体角色和实体关系,对于多个领域的自动知识获取至关重要。大多数文档级EE系统构建的是抽取模型,这些模型在文档层面难以建模实体之间的长程依赖关系。为了解决这一问题,我们提出了一种生成框架,用于两个文档级EE任务:角色填充实体抽取(Role-Filler Entity Extraction, REE)和关系抽取(Relation Extraction, RE)。我们首先将这两个任务形式化为模板生成问题,使模型能够高效地捕捉跨实体依赖关系,利用标签语义,并避免识别N元关系时的指数计算复杂度。我们将一种新颖的交叉注意力引导复制机制——TopK Copy——融入预训练的序列到序列模型中,以增强模型在输入文档中识别关键信息的能力。实验结果表明,在MUC-4和SciREX数据集上,该方法在REE(+3.26%)、二元RE(+4.8%)和四元RE(+2.7%)的F1分数上均取得了新的最佳结果。

代码仓库

PlusLabNLP/TempGen
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
4-ary-relation-extraction-on-scirexTempGen
Avg. F1: 3.55
binary-relation-extraction-on-scirexTempGen
Avg. F1: 14.47
role-filler-entity-extraction-on-muc-4TempGen
Avg. F1: 57.76

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
文档级实体抽取作为模板生成 | 论文 | HyperAI超神经