
摘要
医学图像分割在协助医疗专业人员进行准确诊断和实现自动化诊断流程中发挥着关键作用。传统的卷积神经网络(CNNs)通常难以捕捉长距离依赖关系,而基于变压器的架构虽然有效,但计算复杂度较高。近期的研究重点在于结合CNNs和变压器以平衡性能和效率,但现有的方法仍然面临在保持低计算成本的同时实现高分割精度的挑战。此外,许多方法未能充分利用CNN编码器捕捉局部空间信息的能力,主要集中在缓解长距离依赖问题上。为了解决这些局限性,我们提出了一种新型的医学图像分割架构QTSeg,该架构能够有效地整合局部和全局信息。QTSeg的特点是具有双混合注意力解码器,旨在通过以下方式增强分割性能:(1) 交叉注意力机制以改善特征对齐;(2) 空间注意力模块以捕捉长距离依赖关系;(3) 通道注意力块以学习通道之间的关系。此外,我们引入了多级特征分布模块,该模块自适应地平衡编码器和解码器之间的特征传播,进一步提升性能。我们在五个公开可用的数据集上进行了广泛的实验,涵盖了多种分割任务,包括病灶、息肉、乳腺癌、细胞和视网膜血管分割。实验结果表明,QTSeg在多个评估指标上优于现有最先进方法,并且保持较低的计算成本。我们的实现代码可以在以下地址找到:https://github.com/tpnam0901/QTSeg (v1.0.0)
代码仓库
tpnam0901/QTSeg
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-image-segmentation-on-bkai-igh | QTSeg | Average Dice (5-folds): 93.13 MAE (5-folds): 0.06 mIoU (5-folds): 88.94 |
| skin-lesion-segmentation-on-isic2016 | QTSeg | ACC: 96.41 Average IOU: 86.74 Dice: 92.42 MAE: 0.0359 |