3 个月前

DifFSS:用于少样本语义分割的扩散模型

DifFSS:用于少样本语义分割的扩散模型

摘要

扩散模型在图像生成任务中展现出卓越的性能。尽管已有多种具有不同网络结构的少样本语义分割(Few-Shot Semantic Segmentation, FSS)模型被提出,但其性能提升已逐渐进入瓶颈期。本文首次将扩散模型引入FSS任务,提出一种名为DifFSS的新范式。DifFSS作为一种创新的FSS框架,能够在不修改现有先进FSS模型网络结构的前提下,显著提升其性能。具体而言,我们利用扩散模型强大的生成能力,以支持图像的语义掩码(semantic mask)、草图(scribble)或软HED边界(soft HED boundary)作为控制条件,生成多样化的辅助支持图像。这一生成过程模拟了查询图像类别内部的多样性,如颜色、纹理变化及光照差异等。由此,FSS模型可参考更为丰富的支持图像,从而学习到更具鲁棒性的特征表示,实现分割性能的持续提升。在三个公开可用的数据集上,基于现有先进FSS模型的大量实验验证了扩散模型在FSS任务中的有效性。此外,本文还深入探讨了扩散模型不同输入设置对分割性能的影响。我们期望这一全新的范式能为融合人工智能生成内容的FSS研究提供重要启发。代码已开源,地址为:https://github.com/TrinitialChan/DifFSS

代码仓库

TrinitialChan/DifFSS
官方
GitHub 中提及

基准测试

基准方法指标
few-shot-semantic-segmentation-on-coco-20i-1BAM (DifFSS, ResNet-50)
Mean IoU: 43.6
few-shot-semantic-segmentation-on-coco-20i-1HDMNet (DifFSS, ResNet-50)
Mean IoU: 46.7
few-shot-semantic-segmentation-on-fss-1000-1HSNet (DifFSS, ResNet-50)
Mean IoU: 86.2
few-shot-semantic-segmentation-on-fss-1000-1DCAMA (DifFSS, ResNet-50)
Mean IoU: 88.4
few-shot-semantic-segmentation-on-pascal-5i-1HDMNet (DifFSS, ResNet-50)
Mean IoU: 70.2
few-shot-semantic-segmentation-on-pascal-5i-1CyCTR (DifFSS, ResNet-50)
Mean IoU: 66.2
few-shot-semantic-segmentation-on-pascal-5i-1BAM (DifFSS, ResNet-50)
Mean IoU: 69.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DifFSS:用于少样本语义分割的扩散模型 | 论文 | HyperAI超神经