
摘要
我们介绍了一种在科学文章中识别和分类实体、关系及共指簇的多任务设置。我们创建了SciERC数据集,该数据集包含所有三项任务的注释,并开发了一个统一框架——科学信息提取器(SciIE),该框架采用了共享片段表示。多任务设置减少了任务之间的级联错误,并通过共指链接利用了跨句子的关系。实验表明,我们的多任务模型在科学信息提取方面优于以往的模型,且未使用任何特定领域的特征。此外,我们还展示了该框架支持构建科学知识图谱,可用于分析科学文献中的信息。
代码仓库
danilo-dessi/skg
tf
GitHub 中提及
https://bitbucket.org/luanyi/scierc
tf
GitHub 中提及
luanyi/DyGIE
tf
GitHub 中提及
YerevaNN/SciERC
tf
GitHub 中提及
KeLi-gavin/CS8750
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| joint-entity-and-relation-extraction-on | SciIE | Cross Sentence: No Entity F1: 64.20 Relation F1: 39.30 |
| named-entity-recognition-ner-on-scierc | SCIIE | F1: 64.20 |