
摘要
去噪扩散概率模型(Denoising Diffusion Probabilistic Models)近期展现出卓越的生成性能,并被用作强大的像素级表征学习器。本文深入剖析了扩散模型内在生成能力与表征学习能力之间的相互关联。为此,我们提出了一种可扩展的自监督表征学习方法——掩码扩散模型(Masked Diffusion Model, MDM),该模型将传统扩散模型中使用的加性高斯噪声替换为掩码机制。所提出的方法在多项基准测试中显著超越先前方法,在医学图像与自然图像的语义分割任务中均取得显著进展,尤其在少样本(few-shot)场景下表现尤为突出。
代码仓库
zx-pan/mdm
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| medical-image-segmentation-on-glas | MDM | Dice: 91.95 F1: 91.95 IoU: 85.13 |
| medical-image-segmentation-on-monuseg | MDM | F1: 81.01 |