
摘要
我们介绍了FREDo,一个少样本文档级关系抽取(FSDLRE)基准。与现有的基于句子级关系抽取语料库的基准不同,我们认为文档级语料库提供了更多的现实性,特别是在“以上都不是”(NOTA)分布方面。因此,我们提出了一组FSDLRE任务,并基于两个现有的监督学习数据集DocRED和sciERC构建了一个基准。我们将最先进的句子级方法MNAV适应到文档级,并进一步开发以提高领域适应性。我们发现FSDLRE是一个具有挑战性的设置,具有新的有趣特征,例如可以从支持集中采样NOTA实例。数据、代码和训练模型已在线提供(https://github.com/nicpopovic/FREDo)。
代码仓库
nicpopovic/fredo
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| few-shot-relation-classification-on-docred | DL-MNAV | F1 (1-Doc): 7.05 F1 (3-Doc): 8.42 |
| few-shot-relation-classification-on-fredo | DL-MNAV | F1 (1-Doc): 7.05 F1 (3-Doc): 8.42 |
| few-shot-relation-classification-on-fredo-1 | DL-MNAV+SIE+SBN | F1 (1-Doc): 2.85 F1 (3-Doc): 3.72 |
| few-shot-relation-classification-on-scierc | DL-MNAV+SIE+SBN | F1 (1-Doc): 2.85 F1 (3-Doc): 3.72 |