JhaDebesh ; TomarNikhil Kumar ; AliSharib ; RieglerMichael A. ; JohansenHåvard D. ; JohansenDag ; de LangeThomas ; HalvorsenPål

摘要
深度学习在胃肠内镜中的应用可以协助提高临床表现,并有助于更准确地评估病变。为此,能够自动实时勾画感兴趣区域(例如癌症或癌前病变边界识别)的语义分割方法,对诊断和干预都有益处。然而,由于其高度依赖操作者和高分辨率图像质量,内镜图像的准确实时分割极具挑战性。为了在临床环境中使用自动化方法,设计低延迟的轻量级模型至关重要,这样它们才能与低端内镜硬件设备集成。在本研究中,我们提出了一种名为NanoNet的新架构,用于视频胶囊内镜和结肠镜图像的分割。我们提出的架构实现了实时性能,并且相比其他更为复杂的模型具有更高的分割准确性。我们使用包含息肉的视频胶囊内镜和标准结肠镜数据集,以及一个包含内镜活检和手术器械的数据集来评估我们方法的有效性。实验结果表明,我们的架构在模型复杂度、速度、模型参数数量和性能指标之间取得了更好的平衡。此外,该模型的大小相对较小,仅有约36,000个参数,而传统的深度学习方法通常拥有数百万个参数。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-image-segmentation-on-kvasircapsule | NanoNet | DSC: 0.9493 mIoU: 0.9059 |
| medical-image-segmentation-on-medico | NanoNet-A | DSC: 0.7364 FPS: 28.07 Precision: 0.7310 Recall: 0.8566 mIoU: 0.6319 |