
摘要
语义角色标注(SRL)是自然语言处理(NLP)领域中的一个基本而具有挑战性的任务。近年来,SRL的研究主要分为两个方向:1) 基于BIO的方法;2) 基于片段的方法。尽管这些方法普遍应用,但它们都存在一些内在缺陷,即没有考虑论元内部的结构,这可能会限制模型的表达能力。主要问题在于论元是扁平结构,其内部词汇没有确定的子树实现。为了解决这一问题,本文提出将扁平论元片段视为潜在子树,从而将SRL任务转化为树解析任务。具体而言,我们在模型中引入了一种新颖的片段约束TreeCRF(树条件随机场),使其能够感知片段结构,并进一步将其扩展到二阶情况。我们在CoNLL05和CoNLL12基准数据集上进行了广泛的实验。实验结果表明,我们的方法在所有先前的语法无关工作中表现优异,在端到端和使用黄金谓词两种设置下均达到了新的最先进水平。
代码仓库
yzhangcs/crfsrl
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semantic-role-labeling-on-conll-2005 | CRF2o + RoBERTa | F1: 89.54 |
| semantic-role-labeling-on-conll-2005 | CRF2o | F1: 87.87 |
| semantic-role-labeling-on-conll-2005 | CRF2o + BERT | F1: 89.03 |
| semantic-role-labeling-on-ontonotes | CRF2o + BERT | F1: 87.66 |
| semantic-role-labeling-on-ontonotes | CRF2o | F1: 83.66 |
| semantic-role-labeling-on-ontonotes | CRF2o + RoBERTa | F1: 88.32 |
| semantic-role-labeling-predicted-predicates-1 | CRF2O + BERT | F1: 85.45 |