4 个月前

研究文章中科学概念的领域无关提取

研究文章中科学概念的领域无关提取

摘要

我们研究了一项新颖的任务,即从学术文章摘要中提取领域无关的科学概念,并提出了两项贡献。首先,我们通过系统化的注释过程确定了一组通用的科学概念。这组概念被用于在短语层面标注来自科学、技术和医学10个领域的科学摘要语料库,该工作是在领域专家的合作下完成的。生成的数据集用于一系列基准实验,旨在(a)为这项任务提供基线性能,(b)考察不同领域之间的概念可迁移性。其次,我们介绍了两个作为基线的深度学习系统。特别是,我们提出使用主动学习来应对任务中的不同领域问题。实验结果表明:(1)非专家在咨询领域专家后可以达成较高的共识;(2)基线系统实现了相当高的F1分数;(3)主动学习使所需训练数据量几乎减少了一半。

基准测试

基准方法指标
scientific-concept-extraction-on-stm-corpusSciBERT (full data)
Exact Span F1: 65.5
scientific-concept-extraction-on-stm-corpusSciBERT (active learning)
Exact Span F1: 66.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
研究文章中科学概念的领域无关提取 | 论文 | HyperAI超神经