4 个月前

UGCANet:一种用于内窥镜图像分析的统一全局上下文感知Transformer网络与特征对齐方法

UGCANet:一种用于内窥镜图像分析的统一全局上下文感知Transformer网络与特征对齐方法

摘要

胃肠内镜是一种利用装有摄像头和其他仪器的柔性管来检查消化道的医疗程序。这种微创技术可以用于诊断和管理多种胃肠道疾病,包括炎症性肠病、胃肠道出血和结肠癌。在上消化道早期发现和识别病变,以及识别可能具有癌症发展风险的恶性息肉,是胃肠内镜诊断和治疗应用中的关键组成部分。因此,提高胃肠道疾病的检出率可以通过增加及时医疗干预的可能性显著改善患者的预后,这不仅可能延长患者的生命,还能改善其整体健康状况。本文提出了一种基于Transformer的新型深度神经网络,该网络设计为同时执行多个任务,从而能够准确识别上消化道病变和结肠息肉。我们的方法引入了一个独特的全局上下文感知模块,并利用强大的MiT主干网(MiT backbone)及特征对齐块(feature alignment block),以增强网络的表征能力。这一创新设计在各种内镜诊断任务中显著提升了性能。广泛的实验结果表明,我们的方法相比其他最先进方法表现出优越的性能。

基准测试

基准方法指标
medical-image-segmentation-on-cvc-clinicdbUGCANet
mIoU: 0.907
mean Dice: 0.950
medical-image-segmentation-on-kvasir-segUGCANet
mIoU: 0.881
mean Dice: 0.928

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
UGCANet:一种用于内窥镜图像分析的统一全局上下文感知Transformer网络与特征对齐方法 | 论文 | HyperAI超神经