Claudia VaneaJonathan CampbellOmri DodiLiis SalumäeKaren MeirDrorith Hochner-CelnikierHagit HochnerTriin LaiskLinda M. ErnstCecilia M. LindgrenChristoffer Nellåker

摘要
我们提出一个全新的基准数据集——Placenta,用于一个尚未充分探索的领域:基于胎盘组织全切片图像中的细胞图(cell graphs)进行节点分类,以预测微细解剖组织结构。这一问题对图学习方法构成了独特挑战,主要原因有以下几点:细胞图规模庞大(每幅图像包含超过一百万个节点),节点特征多样(包含11种细胞类型的64维特征),类别标签严重不平衡(共9个类别,占比从数据集的0.21%至40.0%不等),且细胞群体聚集成异质分布的组织区域,其规模差异极大(单个结构的节点数从11个到44,671个不等)。在此,我们发布了一个包含两幅胎盘组织切片图像的细胞图数据集,总计包含2,395,747个节点,其中799,745个节点附有真实标签(ground truth)。我们针对7种可扩展模型提供了归纳式(inductive)基准测试结果,并展示了细胞图的独特性质如何推动新型图神经网络架构的发展。
代码仓库
nellaker-group/placenta
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| node-classification-on-placenta | GraphSAGE | Accuracy (%): 64.88±0.43 |
| node-classification-on-placenta | ClusterGCN | Accuracy (%): 64.24±1.21 |
| node-classification-on-placenta | GraphSAINT | Accuracy (%): 63.94±0.23 |
| node-classification-on-placenta | ShaDow | Accuracy (%): 63.04±0.77 |
| node-classification-on-placenta | SIGN | Accuracy (%): 64.77±0.43 |