
摘要
我们针对全切片图像(Whole Slide Image, WSI)分类这一具有挑战性的问题展开研究。WSI具有极高的分辨率,且通常缺乏局部标注信息。当仅有切片级别的标签可用时,WSI分类可被建模为多实例学习(Multiple Instance Learning, MIL)问题。为此,我们提出了一种基于MIL的WSI分类与肿瘤检测方法,该方法无需依赖局部标注信息。我们的方法包含三个核心组件:首先,我们提出一种新颖的MIL聚合器,采用双流架构并引入可学习的距离度量机制,以建模实例之间的关系;其次,鉴于WSI可能产生规模庞大或分布不均的“包”(bags),这对MIL模型的训练构成挑战,我们引入自监督对比学习,以提取适用于MIL的高质量特征表示,同时有效缓解大规模“包”带来的高昂内存开销问题;第三,我们采用金字塔融合机制对多尺度WSI特征进行整合,进一步提升了分类与定位的准确性。我们在两个具有代表性的WSI数据集上对所提模型进行了评估,结果表明,该模型的分类准确率与全监督方法相比仅存在不到2%的差距,在多个数据集上均表现优异,显著优于以往所有基于MIL的方法。此外,在标准MIL数据集上的额外基准测试结果进一步验证了所提出MIL聚合器在通用MIL任务中的优越性能。项目代码已开源,详见GitHub仓库:https://github.com/binli123/dsmil-wsi
代码仓库
binli123/dsmil-wsi
官方
pytorch
GitHub 中提及
Xiyue-Wang/RetCCL
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multiple-instance-learning-on-camelyon16 | DSMIL | ACC: 0.8682 AUC: 0.8944 |
| multiple-instance-learning-on-camelyon16 | DSMIL-LC | ACC: 0.8992 AUC: 0.9165 |
| multiple-instance-learning-on-elephant | DSMIL | ACC: 0.929 |
| multiple-instance-learning-on-musk-v1 | DSMIL | ACC: 0.947 |
| multiple-instance-learning-on-musk-v2 | DSMIL | ACC: 0.934 |
| multiple-instance-learning-on-tcga | DSMIL-LC | ACC: 0.9286 AUC: 0.9583 |
| multiple-instance-learning-on-tcga | DSMIL | ACC: 0.9190 AUC: 0.9633 |