
摘要
早期发现视网膜疾病是预防患者出现部分或永久性失明最为重要的手段之一。本研究提出了一种新型的多标签分类系统,用于基于来自多种来源的眼底图像检测多种视网膜疾病。首先,利用多个公开可用的眼底疾病分类数据集,构建了一个新的多标签视网膜疾病数据集——MuReD数据集。随后,实施一系列后处理步骤,以确保图像数据的质量以及数据集中所包含疾病的覆盖范围。在眼底图像的多标签疾病分类任务中,首次采用通过大量实验优化的基于Transformer的模型进行图像分析与决策判断。为优化所提出系统的配置,开展了大量实验。结果表明,该方法在疾病检测和疾病分类任务上的AUC评分分别较现有最先进方法提升了7.9%和8.1%。这些结果进一步证实了基于Transformer的架构在医学影像领域具有广阔的应用潜力。
代码仓库
smlab-niser/23retinald
pytorch
GitHub 中提及
manuel-rdz/c-tran
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| classification-on-mured-dataset | C-Tran, preprocessing, augmentation | ML AUC: 0.962 ML F1: 0.573 ML mAP: 0.685 |