
摘要
语义图像分割是指将图像中的每个像素标记为其对应的类别。基于编码器-解码器架构的方法,如U-Net及其变体,是解决医学图像分割任务的一种流行策略。为了提高U-Net在各种分割任务上的性能,我们提出了一种称为DoubleU-Net的新架构,该架构由两个堆叠在一起的U-Net架构组成。第一个U-Net使用预训练的VGG-19作为编码器,该编码器已经从ImageNet中学习到了特征,并可以轻松迁移到其他任务。为了更高效地捕获更多的语义信息,我们在底部添加了另一个U-Net。此外,我们采用了空洞空间金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)来在网络内部捕获上下文信息。我们使用四个医学分割数据集对DoubleU-Net进行了评估,涵盖了多种成像模态,如结肠镜检查、皮肤镜检查和显微镜检查。在MICCAI 2015分割挑战赛、CVC-ClinicDB、2018年数据科学碗挑战赛和病灶边界分割数据集上的实验表明,DoubleU-Net优于U-Net和基线模型。此外,DoubleU-Net生成了更精确的分割掩膜,特别是在CVC-ClinicDB和MICCAI 2015分割挑战赛数据集中表现突出,这些数据集包含了一些具有挑战性的图像,例如较小和平坦的息肉。这些结果展示了相对于现有U-Net模型的改进。在多个医学图像分割数据集上取得的令人鼓舞的结果表明,DoubleU-Net可以作为医学图像分割和跨数据集评估测试的强大基线模型,用于衡量深度学习(Deep Learning, DL)模型的泛化能力。
代码仓库
DebeshJha/2020-CBMS-DoubleU-Net
官方
tf
GitHub 中提及
harsh-jadhav/SIIM-Pneumothorax-Case-Study2
tf
GitHub 中提及
mehul-k5/Double-Unet
tf
GitHub 中提及
Janetteeeeeeee/double_unet
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| lesion-segmentation-on-isic-2018 | DoubleU-Net | mean Dice: 0.8962 |
| medical-image-segmentation-on-2015-miccai | DoubleUNet | Dice: 0.7649 |
| medical-image-segmentation-on-2018-data | DoubleUNet | Dice: 0.9133 Precision: 0.9596 Recall: 0.6407 mIoU: 0.8407 |
| medical-image-segmentation-on-cvc-clinicdb | DoubleUNet | mean Dice: 0.9239 |
| medical-image-segmentation-on-kvasir | DoubleUNet | DSC: 0.9038 |
| semantic-segmentation-on-kvasir-instrument | DoubleUNet | DSC: 0.9038 mIoU: 0.8430 |