3 个月前

OQM9HK:面向材料科学中机器学习的大规模图数据集

OQM9HK:面向材料科学中机器学习的大规模图数据集

摘要

我们提出一个大规模的晶体材料量子力学计算属性数据集,用于图表示学习,该数据集包含约90万个条目(OQM9HK)。该数据集基于包含超过一百万条目的开放量子材料数据库(Open Quantum Materials Database, OQMD)v1.5版本构建,是此前包含约60万个条目的OQMD v1.2数据集(OQM6HK)的继任版本。我们开发了一种图构建算法,用于生成一种带有二值边标签(Binary Edge-Labeled, BEL)的图结构,以表示晶体材料。相较于无边标签的图结构,BEL图在表征晶体结构方面具有更高的表达能力。在材料性能预测任务中,基于BEL图数据集训练的晶体图神经网络,其性能优于在其他图数据集上训练的模型。OQM9HK图数据集已发布于Zenodo存储库,访问链接为:https://doi.org/10.5281/zenodo.7124330。

基准测试

基准方法指标
formation-energy-on-oqm9hkCGNN Trio Ensemble
MAE: 0.03658
formation-energy-on-oqm9hkCGNN
MAE: 0.04249 ± 0.00037
formation-energy-on-oqm9hkCGNN Full Ensemble
MAE: 0.03433

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
OQM9HK:面向材料科学中机器学习的大规模图数据集 | 论文 | HyperAI超神经