3 个月前

基于级联注意力解码的医学图像分割

基于级联注意力解码的医学图像分割

摘要

Transformer在医学图像分割任务中展现出巨大潜力,这得益于其通过自注意力机制捕捉长距离依赖关系的能力。然而,传统Transformer在学习像素间的局部(上下文)关系方面存在不足。此前的研究尝试通过在Transformer的编码器或解码器模块中嵌入卷积层来弥补这一缺陷,但往往导致特征不一致的问题。为解决该问题,本文提出一种新型基于注意力机制的解码器——级联注意力解码器(CASCaded Attention DEcoder,简称CASCADE)。CASCADE充分利用了分层视觉Transformer的多尺度特征,其结构包含两个核心组件:i)注意力门控模块,通过跳跃连接融合多层级特征;ii)卷积注意力模块,通过抑制背景信息,同时增强长程与局部上下文建模能力。此外,我们采用多阶段特征与损失聚合框架,以实现更快的收敛速度和更优的性能表现。实验结果表明,引入CASCADE的Transformer模型显著优于当前最先进的基于CNN和Transformer的方法,在Dice系数和平均交并比(mIoU)上分别取得了最高达5.07%和6.16%的提升。CASCADE为设计更高效的注意力机制解码器提供了全新的思路与技术路径。

基准测试

基准方法指标
medical-image-segmentation-on-automaticTransCASCADE
Avg DSC: 91.63
medical-image-segmentation-on-automaticPVT-CASCADE
Avg DSC: 91.46
medical-image-segmentation-on-cvc-clinicdbPVT-CASCADE
mIoU: 0.8998
mean Dice: 0.9434
medical-image-segmentation-on-cvc-colondbPVT-CASCADE
mIoU: 0.7453
mean Dice: 0.8254
medical-image-segmentation-on-etisPVT-CASCADE
mIoU: 0.7258
mean Dice: 0.8007
medical-image-segmentation-on-kvasir-segPVT-CASCADE
mIoU: 0.8776
mean Dice: 0.9258
medical-image-segmentation-on-miccai-2015-1TransCASCADE
Avg DSC: 82.68
Avg HD: 17.34
medical-image-segmentation-on-miccai-2015-1PVT-CASCADE
Avg DSC: 81.06
Avg HD: 20.23
polyp-segmentation-on-kvasir-segPVT-CASCADE
mDice: 0.9258
mIoU: 0.8776

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于级联注意力解码的医学图像分割 | 论文 | HyperAI超神经