Saikat RoyGregor KoehlerConstantin UlrichMichael BaumgartnerJens PetersenFabian IsenseePaul F. JaegerKlaus Maier-Hein

摘要
近年来,基于Transformer的架构在医学图像分割领域引发了广泛关注。然而,由于缺乏大规模标注的医学数据集,其性能难以达到自然图像处理任务中的水平。相比之下,卷积神经网络具有更强的归纳偏置,因而更容易训练至高性能。近期,ConvNeXt架构尝试通过模仿Transformer模块来现代化传统卷积网络。在本研究中,我们在此基础上进一步优化,提出一种专为数据稀缺的医学场景量身定制的现代化、可扩展卷积架构。我们提出了MedNeXt——一种受Transformer启发的大核卷积分割网络,其主要贡献包括:1)构建了一个完整的3D ConvNeXt编码器-解码器网络,用于医学图像分割;2)引入残差式ConvNeXt上下采样模块,以在多尺度间有效保持语义信息的丰富性;3)提出一种新颖的迭代式核尺寸扩展技术,通过上采样小核网络逐步增大卷积核尺寸,从而避免在有限医学数据下性能的过早饱和;4)在MedNeXt架构中实现多层级复合缩放策略(包括深度、宽度与核尺寸)。该方法在CT与MRI模态的四项任务上均取得了当前最优性能,适用于不同规模的数据集,代表了一种面向医学图像分割的现代化深度神经网络架构。相关代码已公开发布于:https://github.com/MIC-DKFZ/MedNeXt。
代码仓库
MIC-DKFZ/MedNeXt
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-image-segmentation-on-amos | MedNeXt-L (5x5x5) | Average Dice: 91.77 |
| medical-image-segmentation-on-synapse-multi | MedNeXt-L (5x5x5) | Avg DSC: 88.76 |