
摘要
结肠镜视频在直肠癌诊断中提供了更为丰富的息肉分割信息。然而,内窥镜的快速移动和近距离观察导致当前方法在空间连贯性和连续低质量帧方面存在较大问题,从而限制了分割精度。在此背景下,我们专注于通过增强相邻特征的一致性和重建可靠的息肉表示来实现稳健的视频息肉分割。为此,本文提出了一种SALI网络,该网络结合了短期对齐模块(Short-term Alignment Module, SAM)和长期交互模块(Long-term Interaction Module, LIM)。SAM通过可变形卷积学习相邻帧的空间对齐特征,并进一步协调这些特征以捕捉更稳定的短期息肉表示。对于低质量帧,LIM将历史息肉表示存储为长期记忆库,并探索回顾关系以交互式地重建当前分割所需的更可靠息肉特征。结合SAM和LIM,SALI网络在视频分割中表现出对空间变化和低视觉线索的强大鲁棒性。大规模SUNSEG基准测试验证了SALI相对于现有最先进方法的优势,分别在四个测试子集上提高了Dice系数2.1%、2.5%、4.1%和1.9%。代码位于https://github.com/Scatteredrain/SALI。
代码仓库
Scatteredrain/SALI
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-polyp-segmentation-on-sun-seg-easy | SALI | Dice: 0.825 S measure: 0.870 Sensitivity: 0.811 mean E-measure: 0.920 mean F-measure: 0.831 weighted F-measure: 0.794 |
| video-polyp-segmentation-on-sun-seg-hard | SALI | Dice: 0.822 S-Measure: 0.874 Sensitivity: 0.830 mean E-measure: 0.920 mean F-measure: 0.822 weighted F-measure: 0.790 |