
摘要
我们将BERT应用于共指消解任务,在OntoNotes(+3.9 F1)和GAP(+11.5 F1)基准测试中取得了显著的性能提升。对模型预测结果的定性分析表明,与ELMo和BERT-base相比,BERT-large在区分相关但不同的实体方面表现尤为出色(例如,总统和首席执行官)。然而,在建模文档级上下文、对话以及提及同义表述方面仍有改进空间。我们的代码和模型已公开发布。
代码仓库
wooseok-AI/Korean_e2e_CR_BERT
tf
GitHub 中提及
mandarjoshi90/coref
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| coreference-resolution-on-conll-2012 | c2f-coref + BERT-large | Avg F1: 76.9 |
| coreference-resolution-on-ontonotes | BERT-large | F1: 76.9 |
| coreference-resolution-on-ontonotes | BERT-base | F1: 73.9 |