
摘要
深度学习作为一类机器学习技术,其快速发展激发了人们在医学影像领域应用该技术的浓厚兴趣。本文提出一种深度学习算法,采用“端到端”训练方法,能够准确检测筛查乳腺X线摄影图像中的乳腺癌。该方法可高效利用具有完整临床标注的数据集,或仅包含图像整体癌症状态(标签)的数据集。在该框架中,仅需在初始训练阶段引入病灶标注,后续训练阶段仅需图像级别的标签,从而摆脱对罕见且难以获取的病灶标注的依赖。我们提出的全卷积网络方法在筛查乳腺X线图像分类任务中表现优异,显著优于以往方法。在数字筛查乳腺X线数据库(DDSM)的数字化胶片乳腺X线图像独立测试集上,最优单模型的每图像AUC达到0.88,四模型平均后AUC提升至0.91(敏感性:86.1%,特异性:80.1%)。在INbreast数据库的全视野数字乳腺X线图像(FFDM)验证集上,最优单模型的每图像AUC达到0.95,四模型平均后AUC进一步提升至0.98(敏感性:86.7%,特异性:96.1%)。此外,我们还证明,基于DDSM数字化胶片乳腺X线图像,采用端到端方法训练的整图分类器,仅需使用INbreast数据集的子集进行微调,即可成功迁移到INbreast的FFDM图像上,且无需额外依赖病灶标注。这些结果表明,基于自动深度学习的方法能够便捷地在异构乳腺X线成像平台中实现高精度训练,具有巨大潜力,可显著提升临床筛查工具的性能,有效减少乳腺X线筛查中的假阳性和假阴性结果。
代码仓库
nyukat/mammography_metarepository
GitHub 中提及
yuyuyu123456/CBIS-DDSM
tf
GitHub 中提及
aralab-unr/ga-mammograms
tf
GitHub 中提及
lishen/end2end-all-conv
官方
tf
GitHub 中提及
gkaposto/end2end_lishen
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| cancer-no-cancer-per-image-classification-on | VGG/ResNet | AUC: 0.75 |