3 个月前

面向文档级关系抽取的自适应铰链平衡损失

面向文档级关系抽取的自适应铰链平衡损失

摘要

文档级关系抽取旨在从多句文本中预测实体之间的关系。一种常见的做法是通过设定多标签分类的阈值来判断实体对之间是否存在关系。然而,在文档级任务中,绝大多数实体对实际上并不存在关系,导致正负样本之间存在严重的类别不平衡问题。我们认为,这种不平衡会影响阈值的选择,进而可能导致错误的“无关系”预测。为此,本文提出通过利用分类阈值与每个关系预测得分之间的距离,对容易的负样本进行降权处理。我们提出的新型自适应铰链平衡损失(Adaptive Hinge Balance Loss)基于该距离度量每类关系的难易程度,从而更加关注那些难以分类的、被错误预测的关系,即少数类的正样本关系。在 Re-DocRED 数据集上的实验结果表明,该方法在平衡策略方面优于其他现有方法。源代码已开源,地址为:https://github.com/Jize-W/HingeABL。

基准测试

基准方法指标
relation-extraction-on-redocredHingeABL
F1: 79.79
Ign F1: 78.82

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向文档级关系抽取的自适应铰链平衡损失 | 论文 | HyperAI超神经