
摘要
本文提出了一种名为EffiSegNet的新颖分割框架,该框架基于预训练的卷积神经网络(CNN)分类器作为主干网络,充分利用迁移学习技术。与传统采用对称U型结构的网络架构不同,EffiSegNet简化了解码器设计,并引入全尺度特征融合机制,有效降低了计算成本和模型参数量。我们在公开可用的Kvasir-SEG数据集上对胃肠息肉分割任务进行了评估,取得了当前最先进的性能表现。具体而言,EffiSegNet-B4网络变体在使用预训练主干网络的情况下,获得了F1分数0.9552、平均Dice系数(mDice)0.9483、平均交并比(mIoU)0.9056、精确率(Precision)0.9679和召回率(Recall)0.9429,据我们所知,这是该数据集上文献报道的最高性能指标。此外,在从零开始训练的情况下,模型仍展现出卓越的性能,达到F1分数0.9286、mDice 0.9207、mIoU 0.8668、Precision 0.9311和Recall 0.9262,显著优于以往方法。这些结果充分证明了精心设计的编码器在图像分割网络中的关键作用,以及迁移学习方法的有效性。
代码仓库
ivezakis/effisegnet
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-image-segmentation-on-kvasir-seg | EffiSegNet-B4 | F-measure: 0.9552 Precision: 0.9679 Recall: 0.9429 mIoU: 0.9056 mean Dice: 0.9483 |
| medical-image-segmentation-on-kvasir-seg | EffiSegNet-B5 | F-measure: 0.9513 Precision: 0.9713 Recall: 0.9321 mIoU: 0.9065 mean Dice: 0.9488 |