3 个月前

一种用于关系三元组抽取的新型级联二值标记框架

一种用于关系三元组抽取的新型级联二值标记框架

摘要

从非结构化文本中提取关系三元组是构建大规模知识图谱的关键步骤。然而,现有方法在处理“重叠三元组”问题上表现不佳——即同一句子中多个关系三元组共享相同实体的情况。本文提出一种全新的视角重新审视关系三元组抽取任务,并基于严谨的问题建模,提出一种新颖的级联二元标注框架(CasRel)。与以往将关系视为离散标签的方法不同,本框架将关系建模为从主语到宾语的函数映射,能够自然地解决重叠三元组问题。实验结果表明,即使在编码器模块仅使用随机初始化的BERT时,CasRel框架已显著优于当前最优方法,充分展现了新标注框架的强大能力。当采用预训练的BERT编码器时,性能进一步提升,在两个公开数据集NYT和WebNLG上,F1分数分别比最强基线高出17.5和30.2个百分点。对各类重叠三元组场景的深入分析显示,该方法在所有场景下均实现了稳定且一致的性能提升。相关源代码与数据已公开发布。

代码仓库

weizhepei/CasRel
官方
tf
GitHub 中提及
Sherlock-coder/CasRel
pytorch
GitHub 中提及
LitianD/Joint_RE
pytorch
GitHub 中提及

基准测试

基准方法指标
relation-extraction-on-nyt10-hrlCasRel (exact)
F1: 70.11
relation-extraction-on-nyt11-hrlCasRel (exact)
F1: 51.25
relation-extraction-on-nyt11-hrlCasRel
F1: 53.9
relation-extraction-on-webnlgHBT (CasRel)
F1: 91.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
一种用于关系三元组抽取的新型级联二值标记框架 | 论文 | HyperAI超神经