
摘要
在科学论文中识别引用意图(例如,背景信息、方法使用、结果比较)对于单篇出版物的机器阅读和科学文献的自动化分析至关重要。我们提出了一种结构支架模型,这是一种多任务模型,旨在将科学论文的结构信息融入引用中,以实现有效的引用意图分类。我们的模型在现有的ACL文集数据集(ACL-ARC)上达到了新的最先进水平,F1分数绝对提高了13.3%,而无需依赖外部语言资源或现有方法中使用的手工设计特征。此外,我们还引入了一个新的引用意图数据集(SciCite),其规模比现有数据集大五倍以上,并涵盖了多个科学领域。我们的代码和数据可在以下网址获取:https://github.com/allenai/scicite。
代码仓库
allenai/scicite
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| citation-intent-classification-on-acl-arc | Structural-scaffolds | Macro-F1: 67.9 |
| citation-intent-classification-on-scicite | Structural-Scaffolds | Macro-F1: 84.99 |
| sentence-classification-on-acl-arc | Structural-scaffolds | F1: 67.9 |
| sentence-classification-on-scicite | Structural-scaffolds | F1: 84 |