
摘要
宽残差网络(Wide-Residual Networks, Wide-ResNets)是残差网络(Residual Networks, ResNets)的一种浅层但宽结构的变体,通过堆叠少量具有较大通道数的残差块实现,在多个密集预测任务中展现出卓越的性能。然而,自提出以来,Wide-ResNet架构在近年来几乎未发生显著演进。在本研究中,我们针对近期极具挑战性的全景分割(panoptic segmentation)任务,重新审视了该架构的设计。全景分割旨在统一语义分割与实例分割任务。我们通过在Wide-ResNets中引入简单而高效的挤压-激励模块(Squeeze-and-Excitation)与可切换空洞卷积(Switchable Atrous Convolution),构建了一个基准模型。随后,通过调整网络的宽度(即通道数)和深度(即层数),进一步扩展或压缩模型容量,从而形成一系列名为SWideRNets(Scaling Wide Residual Networks的缩写)的模型家族。实验表明,这种简洁的缩放策略结合网格搜索,能够有效发现多个SWideRNets模型,在快速模型与强模型两种范式下,均显著提升了全景分割任务在多个数据集上的最先进性能。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| panoptic-segmentation-on-cityscapes-test | Panoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary, multi-scale) | PQ: 67.8 |
| panoptic-segmentation-on-cityscapes-val | Panoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary Vistas, single-scale) | AP: 42.8 PQ: 68.5 mIoU: 84.6 |
| panoptic-segmentation-on-cityscapes-val | Panoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary Vistas, multi-scale) | AP: 46.8 PQ: 69.6 mIoU: 85.3 |
| panoptic-segmentation-on-coco-test-dev | Panoptic-DeepLab (SWideRNet-[1, 1, 4], multi-scale) | PQ: 46.5 PQst: 38.2 PQth: 52.0 |
| panoptic-segmentation-on-mapillary-val | Panoptic-DeepLab (SWideRNet-(1, 1, 4.5), multi-scale) | PQ: 44.8 PQst: 51.9 PQth: 39.3 mIoU: 60.0 |