3 个月前

HySPA:面向可扩展文本到图谱抽取的混合跨度生成方法

HySPA:面向可扩展文本到图谱抽取的混合跨度生成方法

摘要

文本到图谱抽取旨在从自然语言文本中自动提取由实体提及及其类型构成的信息图谱。现有的方法,如表格填充和成对评分,已在多种信息抽取任务中展现出优异的性能,但由于其时间与空间复杂度随输入长度呈二次增长,难以扩展至包含长文本的数据集。为此,本文提出一种混合跨度生成器(HySPA),该方法可将信息图谱可逆地映射为节点与边类型交替组成的序列,并通过一种混合跨度解码器直接生成此类序列。该解码器能够以线性时间与空间复杂度,递归地同时解码实体跨度与类型。在ACE05数据集上的大量实验表明,该方法在联合实体与关系抽取任务上显著优于当前最先进的技术水平。

代码仓库

renll/HySPA
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
relation-extraction-on-ace-2005HySPA
Cross Sentence: No
Sentence Encoder: ALBERT
relation-extraction-on-ace-2005HySPA (ours) w/ RoBERTa
Relation F1: 68.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供