
摘要
医学图像分割是构建医疗系统的关键前提,尤其在疾病诊断与治疗方案规划中具有重要意义。在各类医学图像分割任务中,U型架构(即U-Net)已成为事实上的标准,取得了显著成果。然而,由于卷积操作固有的局部性,U-Net在显式建模长距离依赖关系方面存在局限。相比之下,专为序列到序列预测设计的Transformer架构具备天然的全局自注意力机制,能够有效捕捉全局上下文信息,但其在低层次细节建模方面能力较弱,导致定位精度受限。本文提出TransUNet,该模型融合了Transformer与U-Net的优势,为医学图像分割提供了一种强有力的替代方案。一方面,Transformer将卷积神经网络(CNN)特征图中提取的图像块(patch)进行编码,作为输入序列以获取全局上下文信息;另一方面,解码器对编码后的特征进行上采样,并与高分辨率的CNN特征图融合,从而恢复精细的空间定位信息,实现精确分割。我们论证,Transformer可作为医学图像分割任务中强有力的编码器,结合U-Net结构,通过恢复局部空间信息来增强细节表现能力。在多种医学应用中,包括多器官分割与心脏分割,TransUNet均显著优于现有各类竞争方法。代码与模型已开源,详见:https://github.com/Beckschen/TransUNet。
代码仓库
KenzaB27/TransUnet
tf
GitHub 中提及
PaddlePaddle/PaddleSeg
paddle
mirthai/csa-net
pytorch
GitHub 中提及
yykzjh/pmfsnet
pytorch
GitHub 中提及
hongkunsun/paratranscnn
pytorch
GitHub 中提及
yingkaisha/keras-unet-collection
tf
GitHub 中提及
awsaf49/TransUnet-tf
tf
GitHub 中提及
Beckschen/TransUNet
官方
pytorch
GitHub 中提及
gail-yxie/adawac
pytorch
GitHub 中提及
ljollans/trunet
pytorch
GitHub 中提及
04RR/SOTA-Vision
pytorch
GitHub 中提及
aris-mukherjee/TransUNet-modified
pytorch
GitHub 中提及
MargeryLab/TransUNet
pytorch
GitHub 中提及
ayoub-sudo/Attention-Unet-web-app
GitHub 中提及
simonustc/mcpa-for-2d-medical-image-segmentation
pytorch
GitHub 中提及
mkara44/transunet_pytorch
pytorch
GitHub 中提及
hendraet/synthesis-in-style
pytorch
GitHub 中提及
jack139/ETH_predictor_keras_unet
GitHub 中提及
maloadba/mgenseg_2d
jax
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-image-segmentation-on-acdc | TransUNet | Dice Score: 0.8971 |
| medical-image-segmentation-on-automatic | R50-ViT-CUP | Avg DSC: 87.57 |
| medical-image-segmentation-on-automatic | R50-AttnUNet | Avg DSC: 86.75 |
| medical-image-segmentation-on-automatic | TransUNet | Avg DSC: 89.71 |
| medical-image-segmentation-on-synapse-multi | TransUNet | Avg DSC: 77.48 Avg HD: 31.69 |