3 个月前

用于全景分割的宽残差网络扩展

用于全景分割的宽残差网络扩展

摘要

宽残差网络(Wide-Residual Networks, Wide-ResNets)是残差网络(Residual Networks, ResNets)的一种浅层但宽结构的变体,通过堆叠少量具有较大通道数的残差块实现,在多个密集预测任务中展现出卓越的性能。然而,自提出以来,Wide-ResNet架构在近年来几乎未发生显著演进。在本研究中,我们针对近期极具挑战性的全景分割(panoptic segmentation)任务,重新审视了该架构的设计。全景分割旨在统一语义分割与实例分割任务。我们通过在Wide-ResNets中引入简单而高效的挤压-激励模块(Squeeze-and-Excitation)与可切换空洞卷积(Switchable Atrous Convolution),构建了一个基准模型。随后,通过调整网络的宽度(即通道数)和深度(即层数),进一步扩展或压缩模型容量,从而形成一系列名为SWideRNets(Scaling Wide Residual Networks的缩写)的模型家族。实验表明,这种简洁的缩放策略结合网格搜索,能够有效发现多个SWideRNets模型,在快速模型与强模型两种范式下,均显著提升了全景分割任务在多个数据集上的最先进性能。

基准测试

基准方法指标
panoptic-segmentation-on-cityscapes-testPanoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary, multi-scale)
PQ: 67.8
panoptic-segmentation-on-cityscapes-valPanoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary Vistas, single-scale)
AP: 42.8
PQ: 68.5
mIoU: 84.6
panoptic-segmentation-on-cityscapes-valPanoptic-DeepLab (SWideRNet [1, 1, 4.5], Mapillary Vistas, multi-scale)
AP: 46.8
PQ: 69.6
mIoU: 85.3
panoptic-segmentation-on-coco-test-devPanoptic-DeepLab (SWideRNet-[1, 1, 4], multi-scale)
PQ: 46.5
PQst: 38.2
PQth: 52.0
panoptic-segmentation-on-mapillary-valPanoptic-DeepLab (SWideRNet-(1, 1, 4.5), multi-scale)
PQ: 44.8
PQst: 51.9
PQth: 39.3
mIoU: 60.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于全景分割的宽残差网络扩展 | 论文 | HyperAI超神经