
摘要
我们提出了一种新型高效的语义分割架构,基于“瀑布式”空洞空间池化(Waterfall Atrous Spatial Pooling)结构,在显著降低网络参数量和内存占用的同时,实现了显著的精度提升。所提出的瀑布式(Waterfall)架构在保持与空间金字塔结构相当的多尺度感受野的同时,充分利用了级联结构中逐步过滤的高效性。此外,该方法无需依赖条件随机场(Conditional Random Fields)等后处理阶段,进一步降低了模型复杂度并减少了训练时间。实验结果表明,采用ResNet作为主干网络的瀑布式架构在Pascal VOC和Cityscapes数据集上均取得了当前最优的分割性能,且参数量大幅减少,展现出卓越的鲁棒性与高效性。
代码仓库
bmartacho/WASP
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semantic-segmentation-on-cityscapes | WASPnet (ours) | Mean IoU (class): 70.5% |
| semantic-segmentation-on-cityscapes-val | WASPnet (ours) | mIoU: 74% |
| semantic-segmentation-on-pascal-voc-2012 | WASPnet-CRF (ours) | Mean IoU: 79.6% |
| semantic-segmentation-on-pascal-voc-2012-val | WASPnet-CRF (ours) | mIoU: 80.41% |