Syed Muhammad AnwarAbhijeet ParidaSara AtitoMuhammad AwaisGustavo NinoJosef KitlerMarius George Linguraru

摘要
胸部X光片(Chest X-rays, CXRs)是肺部疾病诊断与预后评估中广泛应用的影像学检查手段。图像分析任务种类多样,包括病理检测、肺部分割等。已有大量研究致力于开发针对特定任务的机器学习算法。近年来一个显著的实例是利用CXRs数据进行新型冠状病毒肺炎(COVID-19)的检测。然而,基于监督学习的传统诊断工具设计方法严重依赖高质量的标注训练数据,以确保临床效果的优化。为此,本文提出一种替代性解决方案——一种新型自监督学习范式,通过基于组掩码(group-masked)的自监督框架,从CXRs中学习通用表征。该预训练模型随后可针对特定领域任务(如COVID-19检测、肺炎识别及一般健康筛查)进行微调。我们进一步证明,同一预训练模型也可应用于肺部分割任务。所提出的范式在多个下游任务中均表现出稳健的性能,充分验证了预训练的有效性。此外,预训练模型在测试阶段面对显著数据分布偏移(data drift)时仍保持良好表现,表明其学习到了更具泛化能力的通用表征。该方法在一项独特的儿科小规模数据集上进行的COVID-19检测任务中进一步得到验证,相较于基于监督学习的Transformer模型,准确率提升约25%,性能优势显著。这一结果有力支持了本研究所提出框架及其预训练策略的优越性与可靠性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| covid-19-diagnosis-on | Thoracic Radiologist | Per-Class Accuracy: 64.37 |
| covid-19-diagnosis-on-covidx-cxr-3 | SS-CXR | Per-Class Accuracy: 98.25 |
| covid-19-diagnosis-on-covidx-cxr-3 | ViT-S | Per-Class Accuracy: 89.25 |
| covid-19-diagnosis-on-covidx-cxr-3 | Inception ResNet | Per-Class Accuracy: 97.5 |
| covid-19-diagnosis-on-covidx-cxr-3 | DenseNet-169 | Per-Class Accuracy: 98.15 |
| covid-19-diagnosis-on-covidx-cxr-3 | Inception Resnet V2 | Per-Class Accuracy: 97.55 |
| covid-19-diagnosis-on-covidx-cxr-3 | DenseNet-121 | Per-Class Accuracy: 96.5 |
| covid-19-diagnosis-on-covidx-cxr-3 | EfficientNet-B2 | Per-Class Accuracy: 97.6 |
| semantic-segmentation-on-montgomery-county-x | UNETR + SS-CXR | F1-score: 0.9561 |
| semantic-segmentation-on-montgomery-county-x | UNETR+ SS-IN | F1-score: 0.9453 |
| semantic-segmentation-on-montgomery-county-x | UNETR | F1-score: 0.9227 |