3 个月前

超导体科学文献中材料与性能的自动提取

超导体科学文献中材料与性能的自动提取

摘要

在数据驱动型材料科学(材料信息学)领域,从科学文献中自动提取材料及其相关性质正日益受到关注。本文介绍了我们提出的一种解决方案——Grobid-superconductors,该工具能够自动从文本中提取超导材料名称及其相应物理性质。Grobid-superconductors 作为一个 Grobid 模块构建,采用多步骤架构,融合了机器学习与启发式方法,支持原始文本或 PDF 文档作为输入数据。基于 Grobid-superconductors,我们构建了 SuperCon2 数据库,其中包含来自 37,700 篇文献的 40,324 条材料与性质记录。材料(或样品)信息以名称、化学式和材料类别进行表示,并附加形状、掺杂情况、组分替代变量以及基底等辅助信息。所记录的性质包括超导临界温度 Tc,以及在有可用数据时的外加压力和 Tc 测量方法。

基准测试

基准方法指标
ner-on-supermatsuperconductors-Scibert
F1: 77.03
Precision: 73.69
Recall: 80.69

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
超导体科学文献中材料与性能的自动提取 | 论文 | HyperAI超神经