3 个月前

基于自监督预训练的Swin Transformer在三维医学图像分析中的应用

基于自监督预训练的Swin Transformer在三维医学图像分析中的应用

摘要

视觉Transformer(Vision Transformers, ViT)在自监督学习中展现出优异性能,能够有效学习全局与局部表征,并可迁移至下游应用任务。受此启发,我们提出一种面向医学图像分析的新型自监督学习框架,设计了专用于该领域的代理任务。具体而言,本文提出:(i)一种基于3D Transformer的新型模型——Swin UNETR(Swin UNEt TRansformers),其采用分层编码器结构,用于自监督预训练;(ii)针对人体解剖结构内在规律设计的定制化代理任务。我们在5,050张来自不同人体器官的公开可用计算机断层扫描(CT)图像上成功实现了该模型的预训练。通过在“颅骨以外”(Beyond the Cranial Vault, BTCV)分割挑战赛(涵盖13个腹部器官)以及医学分割十项全能(Medical Segmentation Decathlon, MSD)数据集的分割任务上对预训练模型进行微调,验证了本方法的有效性。目前,该模型在MSD与BTCV两个数据集的公开测试排行榜上均位列第一,处于当前最先进水平。代码地址:https://monai.io/research/swin-unetr

基准测试

基准方法指标
medical-image-segmentation-on-medicalSwin UNETR
Dice (Average): 78.68
NSD: 89.28

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于自监督预训练的Swin Transformer在三维医学图像分析中的应用 | 论文 | HyperAI超神经